키보드나 마우스 대신 인간의 '입'이 중요한 입력장치로 떠오르고 있다. 사람의 말을 알아듣는 똑똑한 컴퓨터가 등장하면서 손가락이 아프도록 키보드를 두드리거나 마우스를 이리저리 클릭하는 수고를 덜 수 있을 것으로 기대된다.
말을 알아듣는 이른바 '음성인식' 기술이 응용된 사례는 이미 생활 곳곳에서 찾아볼 수 있다. 증권정보 전화서비스나 말로 거는 휴대폰 등은 초보적인 음성인식을 이용한 것. 앞으론 보다 똑똑한 음성인식 기술들이 생활 곳곳에 침투하게 된다.음성인식 기술의 출발은 사람의 말을 디지털화하는 데서 출발한다. 음의 강약과 높낮음 등의 특징을 디지털 신호로 바꾼 뒤 데이터베이스에 미리 저장된 음성자료와 비교·분석해 단어 또는 문장의 의미를 컴퓨터가 알도록 하는 방법이다.
음성인식 프로그램을 이용하면 키보드를 누르는 대신 컴퓨터에 음성으로 명령을 내릴 수도 있다. 지난 95년 6월 삼성전자는 강원대와 함께 국내 최초로 '보이스액세스'라는 음성인식 소프트웨어를 개발했다. 보이스액세스는 윈도 상태에서 최대 1만5천개의 명령어 수행이 가능하다. 이런 종류의 소프트웨어는 비록 초보적이지만 'MS 워드', '넷스케이프' 등 응용 프로그램을 음성으로 조작할 수 있으며 '쭛쭛파일을 불러와', '복사해', '저장해'처럼 간단한 기본 명령도 내릴 수 있다.
여기서 좀더 발전한 것이 받아쓰기(Dictation) 소프트웨어. 키보드로 일일이 글자를 치지 않아도 컴퓨터에 말을 하면 글자로 바꿔준다. 음성만으로 문서 작성과 e메일 송수신이 가능하다. IBM과 드래곤시스템스 등이 내놓은 영어와 중국어 받아쓰기 제품이 나와있다. 조만간 한글 받아쓰기 프로그램도 시중에 선보일 전망이다. 이들이 음성을 인식해 글자로 바꾸는 속도는 타이핑에 비해 3배 정도 빠르다.앞으론 윈도와 같은 컴퓨터 운영체제에 음성인식이 기본적으로 내장될 전망이다. 세계 최초의 음성인식 운영체제는 지난 96년 9월 IBM이 발표한 개인용 컴퓨터 운영체제인 'OS/2 워프4.0'. 음성인식 및 받아쓰기 기능을 갖고 있다. 영문 1만단어가 기본으로 내장돼 있고 최고 4만2천단어까지 인식할 수 있다.
그렇다면 영화 '바이센테니얼 맨'이나 '스타워즈'에 나오는 로봇처럼 인간과 자유롭게 대화가 가능한 컴퓨터는 언제쯤 등장할 수 있을까. 현재 기술로는 세계 최고 컴퓨터가 3천단어 정도를 자유롭게 인식하는 수준에 불과하다. 명령을 내리듯 '저·장·해'라고 또박또박 말하는 것이 아니라 마치 다른 사람과 대화하듯 자연스레 내뱉는 말을 인식하기는 아직 힘들다는 뜻. 결국 컴퓨터가 인간의 대화형 언어를 알아듣는 것은 빨라야 2010년 쯤 가능할 것으로 전문가들은 내다보고 있다.
그러나 딱딱하고 제한된 명령어를 내리는 '불편'을 감수한다면 현재 수준에서도 음성인식이 실생활에 응용될 수 있는 분야는 무궁무진하다. 지난 96년 2월 현대자동차는 국내 최초로 '음성인식 자동차'를 개발했다. TV 드라마 '전격 Z-작전'에 나오는 키트카에 비해선 훨씬 뒤떨어지지만 오디오,실내등,비상등,파워윈도,와이퍼,트렁크 등 8가지 음성명령을 인식, 전기신호로 바꾸어 차량제어장치에 전달하는 능력을 갖고 있다.
최근 미국 제너럴모터스는 차량내에서 음성으로 인터넷 접속이 가능한 시스템을 개발했다. 음성으로 'e메일'하면 차량에 장착된 컴퓨터가 자동으로 검색, 수신된 내용을 음성으로 들려주기도 한다고. 물론 음성으로 휴대폰을 거는 것은 기본이다이밖에 영화 '데몰리션맨'에서 나오는 것처럼 가정내 모든 가전기기의 작동을 말로 하는 시대도 조만간 등장할 것이다. 만약 음성인식에 인공지능까지 가미된다면 21세기엔 컴퓨터 아니 로봇과 수다를 떠는 진풍경이 벌어질지도 모를 일이다.
金秀用기자 ksy@imaeil.com
댓글 많은 뉴스
문재인 "정치탄압"…뇌물죄 수사검사 공수처에 고발
이준석, 전장연 성당 시위에 "사회적 약자 프레임 악용한 집단 이기주의"
[전문] 한덕수, 대선 출마 "임기 3년으로 단축…개헌 완료 후 퇴임"
대법, 이재명 '선거법 위반' 파기환송…"골프발언, 허위사실공표"
민주당 "李 유죄 판단 대법관 10명 탄핵하자"…국힘 "이성 잃었다"