ܹ Ѽӱȸ


θ޴


޴

ȸ, ȸ߰ڷ ٷΰ

  • ȸȳ
  • ȸ߰ڷ

 ̾߱

Ȩ > ǽ > ̾߱


글보기, 각항목은 제목, 작성자, 작성일, 조회수, 첨부파일, 내용으로 구분됨
<시사>음성인식기술...
작성자 알짜돌이 작성일 2004. 4. 4. 조회수 1262
음성인식 기술


음성인식 솔루션 전문 벤처기업인 ㈜메텔(대표 김의숙)은 미국 스피치웍스사(미국 나스닥:SPWX)와 공동으로 자연어 음성인식 기술을 이용한 증권 거래 시스템 개발을 국내 최초로 완료하고 2일부터 현대증권에 보이스탁(Voistock) 서비스를 개시했다.

보이스탁 서비스는 증권 거래에 있어 부분적으로만 적용된 적이 있었던 음성인식ASR (Automatic Speech Recognition) 기술을 한 차원 끌어올려 증권거래에 관련된 모든 분야로 확대한 것이 특징이다.

고객들은 음성만으로 주가 조회를 할 수 있음은 물론 계좌 정보, 주문과 체결 안내 등 모든 증권 거래 업무를 간편하게 처리 할 수 있게 됐다.

특히 이번 시스템 개발은 한국어 음성인식에서 문제점으로 여겨지던 일상 생활에서 사용하는 자연어 대화체와 10자리 이상의 연속숫자음 인식을 국내 최초로 완벽히 상용화 하였으며, 안내방송 도중에도 언제든지 “끼어들기”가 가능하고 최대 10만 단어에 달하는 국내 최고의 인식능력을 확보하여 국내 대화체 인식기술을 전화를 통하여 직접 상담원과 주문상담을 하는 수준으로 끌어 올렸다는 평가를 받고 있다.

스피치웍스사의 국제담당 부사장인 스티브 아담스는 현대증권의 서비스가 한국어 음성인식기술에 있어서 역사적인 한 획을 그을 것이며, 그 이유는 현대증권의 서비스가 자연어 처리 및 한국 연속숫자음 인식을 완벽히 소화하고 있기 때문이라고 말했다.

“한국어 숫자음 인식은 대단히 도전적이고 어려운 문제였습니다. 이는 한국 숫자음이 모두 단음절(일,이,삼,사,오 등)로 이루어져 있고 매우 빠른 속도로 발음되기 때문입니다. 메텔과 스피치웍스의 음성학자들은 한국에서의 최초 연속숫자음 인식을 성공적으로 상용화하기 위하여 인식엔진을 최적화하는데 최선을 다하였으며, 그 결과를 대단히 자랑스럽게 생각한다”고 스티브 아담스는 말했다.

이번 개발을 위해 ㈜메텔과 스피치웍스사는 한국어 인식엔진의 기본 모델을 6개월 동안 공동으로 개발했다. ㈜메텔의 음성인식 연구소에서는 국내 지역별 다른 액센트의 원활한 인식과 연속숫자음 인식능력을 최고화하기 위해 스피치웍스의 다국어 인식엔진을 최적화했고, 한국 사용자에 맞는 유연한 사용자 인터페이스 개발과 스피치웍스의 자연어인식문법구조에 한국어의 다양한 문법을 적용할 수 있도록 했다.

메텔의 김의숙 사장은 음성인식 증권거래시스템 상용화의 성공으로 한국어 대화체 음성인식기술이 활용될 수 있는 기반이 마련되어 각종 산업분야에 빠르게 확산될 것이며, “메텔은 이번에 선보인 한 차원 높은 음성인식 기술이 은행, 항공, 철도, 콜 센터 분야에 빠르게 상용화 될 수 있도록 이미 프로토 타입 개발을 완료한 상태”라고 말했다.

또한 “메텔은 한국어 음성인식 발전을 위해 학술 단체와 함께 표준화된 공동 db구축 및 인식 기술 교류에 앞장설 예정”이라며 “앞으로 음성 인식 분야 뿐 아니라 음성 합성 및 화자 인증 부분까지도 진출하겠다“는 포부를 밝혔다.

한편 미국에 본사를 둔 스피치웍스사는 전화망을 이용한 자연어 음성인식 처리 분야의 선두주자로서 미국최고 온라인 증권사인 E*Trade를 비롯하여 United 항공, Yahoo, Citi Group, AOL 등 50여개 사에 자연어 음성인식 시스템을 구축한 바 있다. 스피치웍스사는 전 세계적으로 약 17개 언어에 대한 음성인식시스템을 개발한 회사로 AT&T, Citigroup’s e-Citi Unit, GE Equity, Intel Corporation, The Intel64 Fund, MCI WorldCom Venture Fund , Reuters 등의 투자를 받고 있다.

보이스탁 시스템은 엔진이 세계적인 IVR(Interactive Voice Response)의 인터보이스브라이트(InterVoiceBrite) 음성인식 전용 플랫폼 위에 통합되어 시스템의 안내방송 도중에 언제라도 사용자가 음성을 입력할 수 있도록 개발됐다.


@출처 :2001/02/02 머니투데이
첨부
  •     

ּ ó, ۱

̵