매일신문

한국국학진흥원 "古書 한자 디지털 문자 전환 AI 도움 받는다"

로봇
mWiz 이 기사 포인트

한자 자동 인식 위한 OCR 시스템 개발 착수
1차년, 유교책판 영인 고서 한자 인식률 80%

한국국학진흥원이 고서 속 한자를 자동으로 인식할 수 있는 시스템을 개발하고 있다. 사진은 고서 한자를 자동으로 인식해 변환하는 시스템 모습. 한국국학진흥원 제공
한국국학진흥원이 고서 속 한자를 자동으로 인식할 수 있는 시스템을 개발하고 있다. 사진은 고서 한자를 자동으로 인식해 변환하는 시스템 모습. 한국국학진흥원 제공

고서(古書) 속 한자를 자동 인식할 수 있는 '광학문자인식'(OCR) 시스템 개발사업이 성과를 내고 있다.

경북 안동에 있는 한국국학진흥원은 한국지능정보사회진흥원의 지원을 받아 ㈜누리 IDT, ㈜NHN다이퀘스트, ㈜에프아이솔루션과 함께 OCR 시스템 개발을 진행하고 있다고 5일 밝혔다.

1차년도 사업 결과, 세계기록유산인 유교책판 활자 등 고서의 한자 인식률 정확도를 80%까지 끌어올렸다.

우리나라 기록문화에 가장 많은 부분을 차지하는 고서에 대한 접근성을 높이기 위해서는 고서 내용을 디지털 문자로 치환해 검색과 활용도를 높여야 한다.

이 때문에 한자 해독이 가능한 전문가들이 주요 경전의 내용을 한 글자 한 글자 입력하면서 디지털화 작업을 진행하고 있지만, 수많은 고서 내용을 디지털 문자로 전환하는 일은 상당한 시간과 노력이 필요하다.

국학진흥원은 기존 DB구축 사업을 통해 확보된 이미지와 고해상도의 이미지 스캔을 해둔 결과물을 중심으로 다양한 글자들을 인공지능이 학습할 수 있는 OCR 시스템을 개발하고 있다.

정종섭 한국국학진흥원장은 "산적한 고서들을 활용하기 위한 첫 단계가 디지털화 작업인데, 이번 1년차 사업만으로도 디지털화 속도가 몇 배 이상 빨라졌다"며 "향후 이미지 인식률을 높일 수 있는 사업을 계속 추진할 것"이라 말했다.

최신 기사

mWiz
1800
AI 뉴스브리핑
정치 경제 사회 국제
오는 23일 이재명 대통령의 국정조사 추진을 위한 의원 모임인 '공취모'가 출범하는 가운데, 민주당 내부의 갈등이 심화되고 있다. 특히, 1...
대구에서는 자산·소득 양극화에 따라 소비가 초저가와 초고가 제품으로 양분되는 흐름이 뚜렷해지며, '다이소'가 매장 수를 늘리고 성장세를 보이...
서울행정법원은 학부모 A씨가 초등학생 자녀의 수행평가에 이의를 제기하며 교사에게 인신공격적 표현을 사용한 행위가 교육활동 침해에 해당한다고 ...
브리핑 데이터를 준비중입니다..

많이 본 뉴스

일간
주간
월간