엘론 머스크(Elon Musk)와 샘 알트만(Sam Altman)이 설립한 OpenAI가 AOS장르의 유명 게임인 Dota 2 인공지능의 현 상황을 발표했다.
이들이 발표한 AI는 세계 최고 수준의 인간 프로게이머와 1vs1 대결에서 승리했다. OpenAI 블로그에 따르면 이들의 인공지능은 자기 자신과 대결하면서 성능을 향상시키는 자율 플레이(self-play)방식으로 학습되었고, 사람의 플레이를 보고 따라하는 이미테이션 러닝(imitation learning)이나 사람이 인공지능의 행동 규칙을 정해주는 트리 서치(tree search)와 같은 방식은 사용하지 않았다고 한다.
Dota 2를 플레이하기 위해서는 상황에 숨겨진 여러 정보를 유추할 수 있어야 한다. 특히 상대방을 이기기 위해서는 공격, 수비, 각종 기술 및 속임수가 포함된 복잡한 계획을 세울 수 있어야 한다. 아래 영상을 통해 게임에서 이긴다는 목표를 이루기 위해 AI가 스스로 여러 전략들을 학습했다는 것을 볼 수 있다.
또한 OpenAI는 반응속도에 대한(1분의 몇번 키를 누르고 마우스를 움직일 수 있는지) 인공지능과 인간의 형평성을 위해 평균적인 인간 게이머의 반응속도와 똑같은 속도로 인공지능이 키와 마우스를 누르도록 했다. 상황을 직관적으로 파악하고 그에 맞는 의사결정과 계획을 짜는 능력을 비교하기 위해서이다.
아래는 세계 최고 수준의 1vs1 플레이어 Sumail과 AI의 대결이다.
Dota 2의 풀 게임은 5vs5 팀 게임이다. 5vs5 에서는 훨씬 더 복잡한 상황 판단 능력과 계획 능력 그리고 5명의 플레이어들 간의 의사소통능력과 협동 능력이 요구된다. OpenAI는 이러한 게임을 플레이하는 AI를 만드는 것을 다음 목표로 하고 있다고 한다.
관련 자료: OpenAI blog post – Dota2 , OpenAI blog post – More on Dota2