응용시장 확대를 위한 과제

기술사업화분석실 선임연구원 홍동숙 (Tel: 02-3299-6257  e-mail: hongds@kisti.re.kr )

[요 약]

1  1. 음성인식 솔루션은 IT기기와의 융합이 확대되면서 2017년 세계 시장이 1,100억 달러 규모로 성장할 전망이다.
2. 음성인식기술은 1990년대 AT&T의 전화번호 안내 서비스에 음성인식기술을 적용된 후 지속적으로 발전해 왔으며 2000년대 들어 휴대폰 제조회사들이 적용하기 시작한 ‘말로 거는 전화’ 기능으로 크게 주목받은 바 있다.
3. 하지만 당시에는 낮은 음성인식률로 인해 대중적인 인기를 얻지 못하다가 최근 스마트폰과 클라우드 보급 확산을 통해 재조명 받고 있다.
4. 현재 음성인식 솔루션 시장은 다수의 음성인식 원천기술을 가지고 있는 Nuance사의 독점적인 형태로 발전해오고 있으나 모바일, 웹검색 시장에서는 구글, MS 등의 시장 비중이 증가하고 있다.
5. 음성인식 솔루션이 시장에 성공적으로 안착하기 위해서는 음성인식의 질적 수준 향상은 물론 IT기기에 소외된 사용자 계층에 대한 전략적인 고려가 필요하다.

일반적으로 ‘음성인식(Speech Recognition)’의 개념은 컴퓨터가 음향학적 신호(acoustic speech signal)를 텍스트로 전환(mapping) 시키는 과정으로 정의될 수 있다. 즉, 마이크나 전화를 통하여 얻어진 음향학적 신호를 단어나 단어 집합 또는 문장으로 변환하는 과정을 의미한다고 할 수 있다. 인식된 결과는 명령이나 제어, 테이터 입력, 문서 준비 등의 응용 분야에서 최종결과로 사용될 수 있으며, 음성이해와 같은 분야에는 언어 처리과정의 입력으로 사용될 수 있다.

음성인식기술은 인간과 컴퓨터 간의 자연스러운 의사소통을 가능케 하여 컴퓨터를 인간에게 보다 밀착시킬 수 있다는 점에서 상당한 가치를 가지는데 특히 음성커뮤니케이션 수단인 전화 및 모바일기기와 융합하여 큰 시장을 형성할 것으로 기대된다.

음성인식의 과정은 크게 전처리부와 인식부로 구분되는데 전처리부는 사용자가 발성한 음성으로부터 인식 대상이 되는 구간을 찾아 잡음을 제거하고 인식 과정을 위한 특징을 추출하는 과정이고, 인식부는 입력된 음성을 음성 데이터베이스와의 비교를 통해 가장 가능성 있는 단어를 인식결과로 출력하거나 비교 단어를 제한하여 문장을 인식하는 과정을 가르킨다. 기술분류 측면에서, 음성인식기술은 사용자에 따라 화자종속방식, 화자독립방식, 화자적응방식으로 분류될 수 있고, 발음방식에 따라 고립단어인식, 핵심어 인식, 연결단어인식, 연속음성인식, 대화음성인식으로 구분되며, 인식대상이 무엇이냐에 따라 단어단위로 인식하면 단어인식기술, 음소단위로 인식하면 가변어 인식기술로 분류된다.

▲ 자료 : IRS Global(2013)
시장동향 및 예측    
음성인식 기술은 1952년 미국 AT&T 벨연구소의 숫자 인식기 개발 프로젝트로 시작되었고 일찍이 컴퓨터의 등장과 자취를 같이 한 오래된 기술이다. 현재 기술은 대략적으로 2007년 이후 나타난 정보서비스에 접근하기 위한 대화시스템과 유비쿼터스 환경을 묶어 4세대 기술로 통칭되고 있으며 현재 관련연구가 세계 각국에서 활발하게 진행되고 있는 기술이다.

음성인식 기술이 처음 상용화된 사례는 1990년대 AT&T의 전화번호 안내 서비스에 음성인식기술을 적용한 것으로 알려져 있으나 대표적인 상용화 사례로는 10여 년 전 휴대폰 제조회사들이 적용하기 시작한 ‘말로 거는 전화’ 기능이라고 할 수 있다. 당시 음성인식기술은 크게 이슈가 된 바 있으나, 낮은 음성인식률로 인해 대중적인 인기를 얻지는 못하였다. 하지만, 최근 스마트폰과 클라우드 보급 확산을 통해 재조명 받고 있으며, 특히 음성검색서비스 시장에 대한 관심이 증폭되기 시작하였다. 일례로 최근 공개된 아이폰의 음성인식기술 기반 앱인 ‘시리(Siri)’는 동기술의 미래에 대한 긍정적인 반응을 이끌고 있다.

시리뿐만 아니라 구글, 마이크로소프트 등 주요 IT 대형 밴더들도 자사의 핵심 제품과 서비스에 음성인식 기술을 적용 중이며, 기술보유 업체와의 제휴 혹은 적극적 인수를 통해 관련 기술을 확보하고 있고 자동차, 의료, 방송, 교육 등의 분야에서도 음성 인식기술의 활용이 증가하는 추세이다.

응용분야가 확대되면서 음성인식기술관련 시장규모는 시장조사 기관과 기술 범위에 따라 차이는 있으나 2013년 기준 620억 달러로 추정되고 있으며, 2017년에는 약 1,100억 달러를 넘어설 것으로 예상되고 있다. 지역별로는 북미시장이 가장 클 것으로 추정되며, 다음으로 유럽, 아시아시장 순이다. 국내시장의 경우 삼성경제연구소에 따르면 2013년 기준 약 5,530억원의 시장을 형성할 것으로 발표된 바 있다. 특히 국내시장의 경우 세계시장보다 더욱 빠른 증가세를 보일 것으로 예상된다.

다만 국내 음성인식솔루션시장의 성장이 빠르게 진행되고 있는 것은 사실이나 아직까지 국내기술의 발전은 더디게 이루어지고 있는 상황이다. 실제로 국내 대기업들이 다수의 음성인식 원천기술을 보유한 Nuance사에 지불하는 라이센스 비용이 1,000억이 넘는 것으로 추정되고 있고, 해당 기술들도 한국어 인식에는 일부 적합하지 않은 부분들이 존재하여 음성인식 서비스의 질적 향상에 장애요인이 되고 있다. 또한 프라이버시 침해 가능성에 대한 제도적인 미비도 동 시장 성장에 장애요인으로 작용할 가능성이 있다.

시장경쟁상황   
현재 음성인식기술이 응용되는 대표적인 시장으로는 크게 엔터프라이즈 시장, 통신시장, 음성포털 시장을 들 수 있다. 이 중 의료, 법률, 텔레매틱스, 물류, 콜센터, 스마트 홈, 군대 등을 포함하는 엔터프라이즈 시장과 휴대전화 기기 속에서 응용되는 통신시장에서는 다수의 음성인식 원천기술을 가지고 있고 시리에 음성검색엔진을 공급하고 있는 Nuance사가 압도적으로 시장을 지배하고 있다.

음성인식기술 전분야에서 Nuance사의 세계시장 점유율은 약 70%로 파악되며 국내시장에서도 약 90%의 시장점유율을 유지하고 있는 것으로 알려져 있다.

다만 모바일 음성검색 서비스를 포함하는 음성 포털 시장에서는 Google과 MS가 시장을 주도하고 있으며, Nuance사는 클라우드 컴퓨터 기반으로 변화하는 흐름에 대한 대응이 늦었다는 평가를 받고 있다. 구글은 영어, 일본어, 프랑스어, 한국어 등 15개국에 모바일 음성 검색 서비스 앱을 출시중이며, 클라우드 컴퓨팅 기반이라는 장점을 가지고 있다. MS역시 음성인식 개발업체 ‘텔미 네트웍스’를 인수하여 자사의 검색엔진인 ‘빙(Bing)’을 통한 음성검색 서비스를 제공하고 있다.

 <그림 1> 음성기반인식 솔루션 Nuance사의 시장점유율(좌: 세계시장, 우:국내시장)
국내 포털 업체 중에서는 다음과 네이버가 음성인식 기술을 확보한 상태이며, 특히 다음은 ETRI와 공동 연구한 음성검색 원천기술을 이용해서 음성검색 인식률을 90%까지 끌어올리는 등 기술개발을 주도하고 있다.

이슈주제: IT 소외계층으로의 시장확대
음성은 인간이 가진 가장 직관적이고 간편한 입력 도구이다. 그동안 여러 가지 기술적인 어려움에도 불구하고, 다수의 기업과 기관에서 음성인식기술을 개발해온 이유는 이러한 음성의 직관성에 주목했기 때문이다. 아직 음성인식 기술의 경우 음성을 인식하고 문맥에 맞게 해석하는 기술이 소비자의 기대수준에 미치지 못하여 터치스크린이나 다른 대체 기술들 만큼 시장을 확대시키지 못한 것이 사실이다. 하지만 음성인식의 기술 수준이 소비자 요구를 만족하게 된다면 시장은 폭발적으로 성장할 가능성이 있다. 다행히 최근 시맨틱 검색(Symantic Search)의 발달과 시리 등 자연어 기반 새로운 서비스의 확산은 시장성장의 가능성을 높이고 있다.

기본적으로 음성인식기술은 다양한 IT기기와 융합하여 그 파급력이 극대화 될 수 있다. 일례로 TV나 내비게이션 등에서 음성인식기술이 확산된다면 기존의 입력수단을 상당부분 대체할 것으로 기대된다.

하지만, 음성인식기술이 단지 IT 사용에 익숙한 사용자 계층을 겨냥하고 있는 것만은 아니다. 음성자체의 직관성을 활용하여 IT 소외계층이라는 새로운 사용자그룹을 IT기기와 서비스로 유인할 수 있다.

실제로 음성인식 기술은 노인, 장애인, 어린이 등 기존 IT기기에 익숙하지 못한 계층에게 더 큰 효용을 제공한다. 다시 말해 신규시장 창출 측면에서 IT 소외계층에 대한 고려는 음성인식기술이 성공적으로 확산되는데 필수적이라고 할 수 있다.

일례로 미쓰비시(Mitsubishi)전기가 장애인을 위한 음성인식 엘리베이터 시스템을 개발한 것이나 인텔, GE 등이 음성인식 기술을 활용해 노인이나 장애인의 보조기기를 개발한 사례 등은 사회적인 요구에 대응하는 차원은 물론 새로운 수요창출이라는 전략적 고려가 더해진 결과라고 할 수 있다.

저작권자 © 넥스트미디어 무단전재 및 재배포 금지