매일신문

네이버, '클로바X' 시각 정보 처리 능력 업데이트…음성과 이미지까지 확대

로봇
mWiz 이 기사 포인트

네이버의 하이퍼클로바X가 이미지의 차트를 이해하는 이미지. 사진=네이버 제공
네이버의 하이퍼클로바X가 이미지의 차트를 이해하는 이미지. 사진=네이버 제공

네이버의 대화형 AI 에이전트 클로바X(CLOVA X)가 오는 27일 서비스 업데이트를 통해 시각 정보 처리 능력을 새롭게 추가한다.

이번 업데이트가 완료되면 사용자들은 클로바X 대화창에 업로드한 이미지에서 추출된 정보와 입력한 질의를 바탕으로 AI와 대화할 수 있다. 클로바X는 사진 속 현상을 묘사하거나 상황을 추론하는 등 다양한 지시를 수행할 수 있다. 네이버 관계자는 "예를 들어 이미지나 그림 형식으로 되어 있는 표, 그래프를 클로바X가 이해하고 분석하는 것이 가능하다"라며 "기존의 클로바X가 논리적 글쓰기, 코드 작성, 번역 등의 작업에 활발히 사용된 것에서 더 나아가, 이미지 이해 능력을 기반으로 개인의 생산성 향상 도구로서 활용 범위가 한층 넓어질 것으로 기대된다"고 설명했다.

특히 네이버의 AI 기반 문서 처리 및 문자 인식 기술 노하우와, 다양한 분야 지식을 갖춘 거대 언어 모델(Large Language Model, LLM)인 하이퍼클로바X가 결합해 더 정확하고 신뢰성 있는 서비스를 제공할 수 있다.

네이버 측은 대한민국 초·중·고등학교 검정고시 총 1천480개 문항을 AI 모델에 이미지 형태로 입력하고 문제를 풀게 한 결과, 클로바X는 약 84%의 정답률을 기록하며 오픈AI GPT-4o의 78%보다 높은 정답률을 보였다고 밝혔다.

앞서 네이버는 지난 20일, '클로바' 공식 사이트의 기술 블로그를 통해 하이퍼클로바X 기반 음성 AI 기술을 공개했다. 기존의 음성 인식, 음성 합성 기술보다 한층 발전한 모델이다.

성낙호 네이버클라우드 하이퍼스케일(Hyperscale) AI 기술 총괄은 "거대 언어 모델로 출발한 하이퍼클로바X는 이미지 이해 능력을 더한 거대 시각 언어 모델(Large Vision Language Model), 나아가 음성 멀티모달 언어 모델로 발전하고 있다"며 "하이퍼클로바X의 발전된 능력은 대화형 AI 에이전트 클로바X를 비롯한 여러 네이버 서비스에 도입해 새로운 사용자 가치를 창출하고, 기업용 AI 솔루션으로도 제공하며 하이퍼클로바X 생태계를 더욱 확장해나갈 것"이라고 말했다.

0700
AI 뉴스브리핑
정치 경제 사회 국제
이진숙 전 방송통신위원장은 대구시장 선거에 출마하며 대구의 '첫 여성 단체장' 시대를 준비하고 있다고 밝혔다. 그는 대구의 경제적 문제를 해...
이달 원/달러 환율이 1,470원을 넘어서며 1998년 이후 최고치를 기록한 가운데, 중동 전쟁의 여파로 원화가치가 급락하고 있어 1,500...
경기 남양주에서 20대 여성을 살해한 40대 남성 A씨가 의식 불명 상태로 경찰의 구속영장 신청이 지연되고 있으며, A씨는 범행 후 전자발찌...
이스라엘과 미국의 이란 폭격으로 중동 전쟁이 발발한 가운데, 이란 이슬람혁명수비대(IRGC)는 네타냐후 이스라엘 총리를 살해하겠다고 공언했으..

많이 본 뉴스

일간
주간
월간