매일신문

DGIST, '2023년 인공지능 학습용 데이터 구축 지원 사업' 과제 선정

로봇
mWiz 이 기사 포인트

AI 학습용 한국어 말뭉치 데이터 구축…대화형 서비스 한국어 성능 향상 기대
과기정통부·NIA로부터 총 14억원 지원받아 과제 착수

왼쪽부터 DGIST 김대훈·송진영 교수, 인하대 김도국 교수, 빅웨이브아이 대표 이희준, 유니바 대표 남명진. DGIST 제공.
왼쪽부터 DGIST 김대훈·송진영 교수, 인하대 김도국 교수, 빅웨이브아이 대표 이희준, 유니바 대표 남명진. DGIST 제공.

대구경북과학기술원(DGIST)은 '한국어 성능이 개선된 초거대 AI 언어모델 개발 및 데이터 구축'을 목표로 과학기술정보통신부, 한국지능정보사회진흥원(NIA)이 주관·시행하는 '2023년 인공지능 학습용 데이터 구축 지원 사업'에 선정됐다고 5일 밝혔다.

이에 따라 DGIST는 과기정통부와 NIA로부터 총 14억원의 국비를 지원받아 과제에 착수했다.

이번 과제에는 과제 책임자인 DGIST 전기전자컴퓨터공학과 김대훈 교수를 중심으로 송진영 교수 연구팀, 인하대 김도국 교수 연구팀과 ㈜빅웨이브에이아이, DGIST 학생창업기업 ㈜유니바가 컨소시엄을 구성해 참여했다.

Chat-GPT, Google의 Bard와 같은 AI 언어 모델 기반 대화 서비스가 등장하면서 많은 사람들이 쉽게 초거대 언어 모델 기반의 서비스를 이용하고 있다. 하지만 이 서비스는 한국어에 대한 이해가 부족해 불편이 크다는 지적이 많았다. 연구팀은 이를 해결하기 위해 양질의 학습용 한국어 말뭉치 데이터 구축 및 모델을 개발해 초거대 AI 언어 모델의 한국어 성능을 개선하는 것을 목표로 하고 있다.

과제의 책임자인 김대훈 교수는 "언어 모델을 학습하기 위한 한국어 데이터가 매우 부족한 상황"이라며 "DGIST, 인하대 연구팀과 관련 기업이 함께 머리를 맞대 초거대 언어 모델 기반 서비스들의 한국어 성능 개선에 크게 기여를 할 수 있을 것으로 기대된다"고 말했다.

mWiz
1800
AI 뉴스브리핑
정치 경제 사회 국제
국민의힘 공천관리위원회는 16일 김영환 충북도지사를 컷오프하고 후보 추가 모집을 결정했으며, 이는 현역 지자체장이 컷오프된 첫 사례로, 이정...
펄어비스의 신작 게임 '붉은사막'의 글로벌 출시를 앞두고 이용자들의 기대감이 높아지며 주가가 상승세를 보이고 있으며, 16일 한국거래소 기준...
정부의 강력한 주택 시장 규제가 계속되는 가운데, 다주택자로 알려진 개그맨 황현희는 자신의 부동산 보유 의사를 밝히며 '부동산은 버티면 된다...
브리핑 데이터를 준비중입니다..

많이 본 뉴스

일간
주간
월간