확 바뀐 구글 번역기, 어떤 비밀이 숨었나

지난 9월 구글은 딥러닝(Deep learning)을 이용해 신경망 기계 번역 시스템(Neural Machine Translation System, 이하 GNMT)을 선보였다. 이후, GNMT 제작자들은 시스템에게 ‘한국어<->영어’ 번역과 ‘일본어<->영어’ 번역을 가르친다면 ‘한국어-일본어’ 번역을 스스로 하도록 만들 수 있을까 궁금해 했고 가능하다는 결론에 도달했다. 바로 ‘제로-샷 번역(Zero-shot translation)’이다. (gif 이미지가 움직이지 않는다면 여기 클릭)

image01

컴퓨터가 단순히 이 둘을 매칭하는게 아니라 깊은 수준의 번역을 하기 위한 개념을 나타낼 수 있도록 자체 언어의 개발을 시도했고 그 결과 탄생한 것이 이 ‘인터링구아(Interlingua)’ – 과학자용 인공 국제어 – 다. 세 언어에서 문장 또는 단어의 유사점을 파악하는 깊은 수준의 표현을 할 수 있다. 좀 복잡할수도 있고, 간단할수도 있지만 이해하도록 훈련받지 않은 것들의 개념을 시스템 스스로 이해하는 것은 이미 사실이 되었으며 이는 엄청난 일이라 할 수 있다.

테크니들 인사이트
구글이 기존의 번역 서비스를 인공지능을 통해 획기적으로 개선했다. 지난 9월 27일 ‘중국어-영어’ 간 번역을 시작으로 일부 언어 변환에 대해서만 적용되던 것을 11월 22일 부터 한국어도 가능하도록 업데이트되었으며, 지금 구글 번역기를 사용해서 한국어를 영어로 바꾸거나 영어를 한국어로 바꿔보면 예전과 확실히 달라진 결과를 직접 눈으로 확인할 수 있다. 이젠 “번역기 돌렸니?” 라는 놀림도 점점 옛말이 되어 가는 듯 하다.

이번 구글의 인공지능 번역 시스템은 텐서플로우 등을 이용해 구현되었다. 단어 또는 문장을 1:1 매칭하는 방식이 아니라 문장 전체를 번역의 단위로 인식하면서, 문맥을 파악하여 결과에 반영할 수 있게 된 것이다. 위 본문에 언급 되었듯 가르치지 않은 언어 간에도 ‘인터링구아(Interlingua)’를 통해 번역을 할 수 있게 됨으로써 진짜 스스로의 지능을 갖춘 기계를 일상에서도 만나게 된 것이다. ‘링구아 프랑카(lingua franca)’ 라는 단어가 있다. 이는 특정 언어를 지칭한다기 보다는 요즘의 영어와 같이 가교의 기능을 수행하는 언어들을 말하는 것인데 구글의 인공지능이 이런 방법으로 ‘행간’을 이해하는 번역을 수행해내는 것이 놀랍다.

인공지능과 머신러닝, 최근 가장 많이 듣는 단어가 아닌가 싶다. 일전에 ‘빅데이터’와 ‘클라우드’라는 단어가 이렇게 유행처럼 업계를 휩쓸고 지나가며 이를 경계하라고 조언했던 피터 틸(Peter Thiel)이 생각도 난다. 하지만 머신러닝은 실제가 없는 것처럼 느껴졌던 이들과 달리 알파고(Alpha Go), 구글 신경망 번역기(GNMT), 아마존 고(Amazon Go)와 같이 우리 생활 속의 서비스로 다가오고 있으며, 개발자들도 이를 어떤식으로 서비스에 활용할지 고민하기 시작했다는 점이 좀 달라 보인다.

구글은 일찌감치 ‘텐서플로우(Tensor flow)’라는 서비스를 오픈소스화 했으며, 얼마 전엔 알파고(Alpha-go)를 만든 딥마인드도 주요 리소스를 깃허브(Github)에 올리며 오픈소스에 동참하고 있다. 아마존 역시 아마존 렉스(Amazon Lex), 아마존 폴리(Amazon Polly), 아마존 리코그니션(Amazon Rekognition)을 공개하며 인공지능 열풍에 가세했다. 우리는 이런 서비스를 ‘개발자’들을 통해 ‘다른 이름’으로 곧 만나게 될 것이다. 인공지능, 이제 더 이상 꿈같은 얘기가 아니다.

관련 기사: Techcrunch | 이미지 출처Phonandroid

RFID, 스마트폰 영상처리로 소프트웨어 개발을 시작했고 삼성테스코에서 이커머스 시스템을 담당했습니다. 현재 3D 입체영상 촬영 원천 기술을 보유한 하드웨어 스타트업에서 일하고 있습니다. 클라리넷 연주를 하며 책읽기와 글쓰기를 좋아합니다.