고서(古書) 속 한자를 자동 인식할 수 있는 '광학문자인식'(OCR) 시스템 개발사업이 성과를 내고 있다.
경북 안동에 있는 한국국학진흥원은 한국지능정보사회진흥원의 지원을 받아 ㈜누리 IDT, ㈜NHN다이퀘스트, ㈜에프아이솔루션과 함께 OCR 시스템 개발을 진행하고 있다고 5일 밝혔다.
1차년도 사업 결과, 세계기록유산인 유교책판 활자 등 고서의 한자 인식률 정확도를 80%까지 끌어올렸다.
우리나라 기록문화에 가장 많은 부분을 차지하는 고서에 대한 접근성을 높이기 위해서는 고서 내용을 디지털 문자로 치환해 검색과 활용도를 높여야 한다.
이 때문에 한자 해독이 가능한 전문가들이 주요 경전의 내용을 한 글자 한 글자 입력하면서 디지털화 작업을 진행하고 있지만, 수많은 고서 내용을 디지털 문자로 전환하는 일은 상당한 시간과 노력이 필요하다.
국학진흥원은 기존 DB구축 사업을 통해 확보된 이미지와 고해상도의 이미지 스캔을 해둔 결과물을 중심으로 다양한 글자들을 인공지능이 학습할 수 있는 OCR 시스템을 개발하고 있다.
정종섭 한국국학진흥원장은 "산적한 고서들을 활용하기 위한 첫 단계가 디지털화 작업인데, 이번 1년차 사업만으로도 디지털화 속도가 몇 배 이상 빨라졌다"며 "향후 이미지 인식률을 높일 수 있는 사업을 계속 추진할 것"이라 말했다.






























댓글 많은 뉴스
'세계 최고 IQ 276' 김영훈 "한국 정부는 친북…미국 망명 신청"
택배 멈춘 새벽, 시작도 못 한 하루…국민 분노 치솟는다
추미애 "국감 때 안구 실핏줄 터져 안과행, 고성·고함에 귀까지 먹먹해져 이비인후과행"
친여 유튜브 출연한 법제처장 "李대통령, 대장동 일당 만난 적도 없어"
원전 재가동 없이는 AI 강국도 없다