알렉사, 8개의 새로운 목소리 추가

아마존 알렉사에 8개의 새로운 목소리가 추가된다. 아마존 폴리(Amazon Polly)가 제공하는 8개의 무료 음성 기술을 사용하여 개발자들이 음성 애플리케이션에 독특한 성격을 부여할 수 있다. 아마존 폴리는 2016년 11월 아마존의 개발자 행사인 re:Invent에서 처음 공개되었다. 오늘날 텍스트 음성 변환 서비스는 음색 효과, 다이내믹 레인지 압축 등의 기능을 제공하므로 실제 음성보다 자연스럽게 들리게 만들 수 있다.

Image result for alexa polly — Source:AWS

현재 아마존 폴리는 24개 언어로 거의 50개에 달하는 목소리로 이야기할 수 있지만, 현재는 8개의 목소리만 알렉사의 스킬 개발에 사용할 수 있다. 폴리는 딥러닝 기술을 활용해 실제 사람 목소리처럼 음성을 합성하는 텍스트 음성 변환(TTS, Text To Speech) 서비스다. 한국어로는 ‘Seoyeon’이라는 이름으로 샘플 텍스트를 음성으로 들어볼 수 있다.

(아마존 폴리 한국어 웹사이트 https://aws.amazon.com/ko/polly/)

아마존의 알렉사 관련 프로그램을 개발하는 개발자는 이제 다양한 음성을 사용할 수 있게 됐다. 또한, 워드프레스의 게시물을 팟캐스트로 전환할 수 있는 플러그인을 제공함으로써 더 많은 사용자가 폴리에 더욱 쉽게 접근할 수 있도록 노력하고 있다.

techNeedle 인사이트

아마존은 아무래도 지난주 구글의 발표가 내심 신경 쓰였던 모양이다. 구글 I/O에서 구글 듀플렉스가 인간의 목소리를 거의 흡사하게 구사하는 모습이 공개됐다. 또한, 구글은 2016년부터 시작한 웨이브넷(WaveNet) 기반의 TTS를 활용한 6개의 새로운 음성을 발표했고, 유명 가수인 존 레전드(John Legend)의 음성도 포함되어 있다. 이에 따라 아마존 역시 알렉사 생태계를 더 많은 사람이 활용할 수 있도록 알렉사 스킬 강화에 나섰다. 본문 마지막 차트를 보면 구글의 스마트 스피커 점유율이 상승하고 아마존의 점유율은 하락 할 것으로 예상하고 있다. 아마존이 음성인식 스피커 시장의 우위를 이어나가기 위해서는 지금보다 더 다양한 음성 기반 서비스를 에코를 통해 제공할 필요가 있다.

관련 기사 및 이미지 출처 : Techcrunch, USA Today

Written by 윤준탁

1인 컨설팅 기업인 에이블랩스(Able Labs)의 대표이며 인공지능 스타트업 크레바스에이아이(Crevasse AI)의 COO로 근무 중입니다. SK플래닛, IBM 등에서 근무했고, 뉴욕대학교(NYU) 기술경영 석사과정을 마쳤습니다. 추천 알고리즘, 아마존, 블록체인, 커머스에 관심이 많고 주로 IT와 커머스 분야에 대해 글을 씁니다. '한 권으로 끝내는 디지털 경제'와 '인공지능 비즈니스 트렌드(공저)'를 출간했습니다.