한국지능정보사회진흥원(이하 NIA)은 과학기술정보통신부(이하 과기정통부) 와 함께 'AI 데이터 품질관리 가이드라인 v3.5'(이하 가이드라인)를 펴냈다고 26일 밝혔다.
가이드라인 v3.5는 2024년 '초거대AI 확산 생태계 조성사업'의 경험을 바탕으로 최신 인공지능 기술과 산업의 변화를 반영했다.
가이드라인은 총 3권으로 구성했다. 1권은 인공지능 데이터 품질관리 프레임워크, 2권은 데이터 구축 방법론 및 오류 대응 전략 실무사례, 3권은 생성형 인공지능 데이터에 특화된 품질관리 방법을 각각 제시하고 있다.
특히 이번 가이드라인은 언어모델(LLM) 뿐만 아니라 다중양식(멀티모달) 데이터, 합성데이터 등 생성형 인공지능을 위한 데이터 특성에 맞춘 신규 지표와 구축 방법론을 별도 제시했다.
가이드라인은 AI허브 홈페이지나 NIA 누리집을 통해 누구나 내려받아 활용할 수 있다. 권별로도 별도 제공해 현장 실무자가 업무 및 관리 범위에 따라 편리하게 참조할 수 있도록 구성했다.
또 데이터 구성의 '잘된 사례 vs 부족한 사례' 비교 분석과 체크리스트 제공 등을 통해 현장 중심의 데이터 품질관리에 실질적인 도움을 줄 것으로 기대된다.
황종성 NIA 원장은 "인공지능 기술의 핵심은 데이터로 인공지능의 생명은 데이터 품질관리에 있다고 할 수 있다"며 "NIA는 빠르게 발전하는 인공지능 기술에 대응하기 위하여 고품질 데이터 생태계 기반이 조성될 수 있도록 지속적으로 인공지능 데이터 품질 가이드라인 및 기준을 고도화하고 제시하겠다"고 밝혔다.































댓글 많은 뉴스
"대체 누가 받는거냐"…고유가 지원금 기준에 자영업자 분통, 무슨일?
"삼성전자 없애버려야"…총파업 앞둔 노조 간부 '격앙 발언' 파장
조국 "빨갱이·간첩 운운 여전"…5·18 맞아 강경 발언
교수 222인 이어 원로 134인까지…추경호, 세몰이 본격화
김부겸 "대통령 관심에 대구시장 의지…TK신공항 추진, 훨씬 쉬워져"