알렉사, 8개의 새로운 목소리 추가

아마존 알렉사에 8개의 새로운 목소리가 추가된다. 아마존 폴리(Amazon Polly)가 제공하는 8개의 무료 음성 기술을 사용하여 개발자들이 음성 애플리케이션에 독특한 성격을 부여할 수 있다. 아마존 폴리는 2016년 11월 아마존의 개발자 행사인 re:Invent에서 처음 공개되었다. 오늘날 텍스트 음성 변환 서비스는 음색 효과, 다이내믹 레인지 압축 등의 기능을 제공하므로 실제 음성보다 자연스럽게 들리게 만들 수 있다.

Image result for alexa polly

Source:AWS

현재 아마존 폴리는 24개 언어로 거의 50개에 달하는 목소리로 이야기할 수 있지만, 현재는 8개의 목소리만 알렉사의 스킬 개발에 사용할 수 있다. 폴리는 딥러닝 기술을 활용해 실제 사람 목소리처럼 음성을 합성하는 텍스트 음성 변환(TTS, Text To Speech) 서비스다. 한국어로는 ‘Seoyeon’이라는 이름으로 샘플 텍스트를 음성으로 들어볼 수 있다.

(아마존 폴리 한국어 웹사이트 https://aws.amazon.com/ko/polly/)

아마존의 알렉사 관련 프로그램을 개발하는 개발자는 이제 다양한 음성을 사용할 수 있게 됐다. 또한, 워드프레스의 게시물을 팟캐스트로 전환할 수 있는 플러그인을 제공함으로써 더 많은 사용자가 폴리에 더욱 쉽게 ​​접근할 수 있도록 노력하고 있다.

Source: USA Today

techNeedle 인사이트
아마존은 아무래도 지난주 구글의 발표가 내심 신경 쓰였던 모양이다. 구글 I/O에서 구글 듀플렉스가 인간의 목소리를 거의 흡사하게 구사하는 모습이 공개됐다. 또한, 구글은 2016년부터 시작한 웨이브넷(WaveNet) 기반의 TTS를 활용한 6개의 새로운 음성을 발표했고, 유명 가수인 존 레전드(John Legend)의 음성도 포함되어 있다. 이에 따라 아마존 역시 알렉사 생태계를 더 많은 사람이 활용할 수 있도록 알렉사 스킬 강화에 나섰다. 본문 마지막 차트를 보면 구글의 스마트 스피커 점유율이 상승하고 아마존의 점유율은 하락 할 것으로 예상하고 있다. 아마존이 음성인식 스피커 시장의 우위를 이어나가기 위해서는 지금보다 더 다양한 음성 기반 서비스를 에코를 통해 제공할 필요가 있다.

관련 기사 및 이미지 출처 : Techcrunch, USA Today