고서(古書) 속 한자를 자동 인식할 수 있는 '광학문자인식'(OCR) 시스템 개발사업이 성과를 내고 있다.
경북 안동에 있는 한국국학진흥원은 한국지능정보사회진흥원의 지원을 받아 ㈜누리 IDT, ㈜NHN다이퀘스트, ㈜에프아이솔루션과 함께 OCR 시스템 개발을 진행하고 있다고 5일 밝혔다.
1차년도 사업 결과, 세계기록유산인 유교책판 활자 등 고서의 한자 인식률 정확도를 80%까지 끌어올렸다.
우리나라 기록문화에 가장 많은 부분을 차지하는 고서에 대한 접근성을 높이기 위해서는 고서 내용을 디지털 문자로 치환해 검색과 활용도를 높여야 한다.
이 때문에 한자 해독이 가능한 전문가들이 주요 경전의 내용을 한 글자 한 글자 입력하면서 디지털화 작업을 진행하고 있지만, 수많은 고서 내용을 디지털 문자로 전환하는 일은 상당한 시간과 노력이 필요하다.
국학진흥원은 기존 DB구축 사업을 통해 확보된 이미지와 고해상도의 이미지 스캔을 해둔 결과물을 중심으로 다양한 글자들을 인공지능이 학습할 수 있는 OCR 시스템을 개발하고 있다.
정종섭 한국국학진흥원장은 "산적한 고서들을 활용하기 위한 첫 단계가 디지털화 작업인데, 이번 1년차 사업만으로도 디지털화 속도가 몇 배 이상 빨라졌다"며 "향후 이미지 인식률을 높일 수 있는 사업을 계속 추진할 것"이라 말했다.































댓글 많은 뉴스
한동훈 "장동혁은 尹세력 숙주일 뿐…보수 팔아넘겨, 끊어내야" 맹비난
국민의힘 새 당명 유력 후보 '미래연대'·'미래를여는공화당'
'절윤' 거부에 폭발… 국힘 25인, 장동혁 사퇴 촉구 "민심 거스른 독단"
장동혁 "尹 무기징역, 참담…절연 앞세워 당 갈라치는 세력 오히려 절연해야" [영상]
'무기징역' 尹 "국민에 많은 좌절·고난 겪게 했다…깊이 사과" [전문] [영상]