아마존, 알렉사에 직접 개발한 AI칩 ‘인퍼런시아’ 쓴다

AWS (Amazon Web Services, 이하 아마존)가 자체 개발한 머신러닝 추론용 인공지능 칩 ‘인퍼런시아’를 알렉사 시스템에 적용했다고 밝혔다. 덕분에 알렉사 사용자들은 더 정확하고 빠른 답변을 알렉사로부터 들을 수 있게 될 전망이다.

최근 애플이 단독 개발한 M1 칩을 새로 나올 맥북과 아이맥 미니에 넣겠다고 발표해 큰 화제가 되었다. M1이 애플 컴퓨터의 성능을 높이기 위해 별도로 만들어진 칩이라면, 아마존의 ‘인퍼런시아’는 아마존의 인공지능 인프라를 위해 특별히 개발된 칩이다.

인퍼런시아란?

앞서 언급한 ‘아마존의 인공지능 인프라’를 추가로 더 쉽게 설명하자면 아마존 EC2의 ‘Inf1 인스턴스‘를 뜻한다. 아마존에서는 EC2 (Elastic Compute Cloud)라는 서비스를 이용해 클라우드에서 다양한 컴퓨팅 인프라를 빌려 쓸 수 있다.

우리가 흔히 게임을 위한 컴퓨터, 문서작업만 가볍게 하기 위한 컴퓨터, 영상 디자인을 하기 위한 컴퓨터 등 각 쓰임새에 따라 다양한 사양의 컴퓨터를 조립하는 것과 비슷한 개념이다.

아마존 EC2에서 머신러닝 추론 (inference) 작업을 위한 사양의 컴퓨터 이름이 ‘Inf1 인스턴스’라고 이해하면 쉽다. 이 인스턴스에 쓰이는 반도체가 ‘인퍼런시아’다.

아마존은 왜 칩을 직접 만들었나?

먼저 머신러닝에서 ‘추론’이 무엇인지 이해할 필요가 있다. 개략적으로 머신러닝 작업은 크게 ‘훈련 (training)’과 ‘추론 (inference)’으로 나뉜다. 아래 그림처럼 ‘훈련’은 기존 데이터를 보여주어 모델이 특정 역할을 수행하도록 훈련시키는 일이다. ‘추론’은 훈련된 모델이 새로운 데이터가 들어왔을 때 잘 작동하도록 하는 일이다.

즉 열심히 훈련한 선수가 실제 대회에 나가 다른 팀 선수와 겨루는 실전 단계가 ‘추론’이다. 아무리 열심히 훈련한 선수라도 실전에서 싸워야 할 선수가 많으면 그에 맞는 전술과 체력이 필요하다.

현재 알렉사를 사용하는 스마트 전자기기는 14만종이 넘고 개수로는 1억개가 넘는다. 그만큼 사용자가 많고, 알렉사가 추론해야 할 데이터가 방대하다. 이는 아마존의 Inf1 인스턴스를 사용할 다른 기업들도 마찬가지 상황이다.

아마존 블로그에 따르면 아마존은 머신러닝 추론을 위해 원래 Nvidia의 그래픽카드가 적용된 ‘G4 인스턴스’를 제공했다. 그러나 새롭게 인퍼런시아가 적용된 ‘Inf1 인스턴스’를 쓰면 알렉사가 사용자의 질문을 듣고 대답을 하기까지 걸리는 시간을 최대 25% 줄일 수 있다고 한다. 비용도 30% 낮출 수 있다.

아마존은 칩을 직접 만들어 비용 절감과 성능 향상이라는 두 마리 토끼를 잡게 되었다. 뿐만 아니라 타사 의존도를 줄이고, 인공지능 시장의 빠른 성장에 대응하는 클라우드 서비스 경쟁력도 확보하게 되었다.

아마존 EC2 Inf1 인스턴스 소개 영상

테크니들 인사이트

최근 화제가 되는 애플과 아마존의 단독 칩 뉴스는 ‘맥북’이나 ‘알렉사’라는 개별 제품 관점도 좋지만 ‘시스템 (비메모리) 반도체 시장’이라는 보다 넓은 관점에서 볼 필요가 있다.

한국과학기술기획평가원이 2019년 발표한 ‘인공지능 반도체’ 자료에 따르면 한국의 주력산업인 반도체 산업은 메모리 반도체 중심이나 글로벌 반도체 시장의 70%는 인텔과 퀄컴이 주도하는 시스템 반도체다. 이 시스템 반도체 시장에서 2019년 기준 한국의 점유율은 4% 뿐이다.

새로운 성장 동력을 위해 시스템 반도체, 그 중에서도 인공지능 반도체에 대한 테크 기업들의 경쟁이 치열하다. 글로벌 점유율을 높이기 위해 국내 인공지능 반도체 산업의 생태계 활성화가 중요한 이유다.

덧) 한국과학기술기획평가원의 ‘인공지능 반도체’ 자료는 인공지능 반도체에 대한 개념과 산업 동향이 친절하게 설명되어 있다. 관심 있는 독자들에게 좋은 자료가 될 것으로 생각된다. 다음 주소에서 볼 수 있다. https://www.kistep.re.kr/c3/sub8.jsp?brdType=R&bbIdx=12627

이미지 출처 : Gartner

Written by

재미있는 일, 의미있는 일을 하려고 합니다. 경영과 기술을 아우르는 글을 씁니다. jaewan@techneedle.com