류현진 선발경기와 스탯캐스트 그리고 인공지능

미국 메이저리그 베이스볼 (이하 MLB) 플레이오프로 접어든 가운데, 팀들 간에 월드시리즈 우승을 향한 경쟁이 뜨겁다. 경기에서 우리 나라의 류현진 혹은 오승환 선수가 타자들을 압도하는 모습 뿐만 아니라, 세계 최고 수준의 선수들이 펼치는 화려한 플레이가 MLB 관람의 묘미라고 있겠다.

그런데 가만히 야구 경기를 보고 있자면, 다른 스포츠에 비해 굉장히 다양한 기록들, 통계들이 존재한다. ‘야구는 기록의 스포츠라고 불리듯, 이러한 방대한 통계 자료들을 토대로 중계진들이 경기 내용, 혹은 선수의 능력을 파악하고 예측하는 점이 흥미로웠다. MLB 구단들은 오래 전부터 다양한 방식으로 이러한 데이터들을 분석해 전력 강화를 위해 활용 하고 있다. 2011년 개봉했던 영화 머니볼(Moneyball)은 MLB 구단 하나인 오클랜드 어슬레틱스(Oakland Athletics)의 데이터에 기반한 운영의 성공을 다루고 있다.

영화 머니볼(Moneyball)에서의 선수 성적 분석 모습. 20년 전엔 가장 앞선 분석 방식이었다. 출처: MarketWatch

오랫 동 경기 기록, 통계들은 기록원들이 직접 눈으로 경기를 보면서 수작업으로 작성 되어 왔다. 이후 스피드 , Pitch F/X 같은 분석 툴을 거쳐 2013 MLB 스탯캐스트(Statcast)라는 혁신적 분석 방식이 도입된 이후 플레이에 대한 양적, 질적인 분석 측면 모두 비약적인 도약을 이루게 되었다는 평이 일반적이다.

스탯캐스트를 통해 수집할 있는 데이터들은 다음과 같다.

1) 투수의 구속, 구종, 궤적, 회전

2) 타격시 타구 궤적, 발사각, 발사 속도

3) 주루시 주자의 주루 평균 속도, 가속도, 반응 속도

4) 수비시 송구 구속, 정확도, 수비 범위, 스피드, 도달 속도

이렇게 모아진 데이터들 일부는 중계 화면에 공개 되어 야구를 재미 있게 있도록 해준다. 위와 같은 분석이 가능하게 배경에는 트랙맨(Trackman Baseball)이라는 회사가 개발한 정밀 레이더와 카이런헤고(Chyronhego)의 옵티컬 카메라(Optical Camera) 기술이 결합이 결정적인 역할을 했다고 보여진다. 트랙맨 레이더의 경우 한국과 일본의 프로야구에서도 도입되어 선수 분석에 활용되고 있다. 

스탯캐스트는 야구장의 홈플레이트 뒤와 3 베이스라인에 설치되어 경기 내내 연속적으로 데이터를 수집하며 야구공을 포함해 필드 위의 모든 선수들의 움직임을 정확하게 추적한다고 한다

경기 내의 모든 움직임을 끝날때까지 추적하다보니 스탯캐스트가 제공하는 데이터는 경기당 7TB (테라바이트) 넘는데, 이는 메이저리그 전체 30 팀이 약 160 경기를 하기에 시즌 전체로 보면 산술적으로  33,600TB 가까운 막대한 데이터들이 생성되는 것이다. 구단마다 이러한 데이터들을 분석해 내기 위해 노력 하지만, 데이터의 양이 워낙 방대해 체계적이고 전문적인 분석 시스템의 필요성이 대두되어 왔다.

이에 따라 최근 MLB 사무국은 아마존 서비스(Amazon Web Service, 이하 AWS) 의 클라우드와 공식 협력 계약을 체결 했다

AWS 가 제공하는 스탯캐스트 기본 아키텍처. 출처: Amazon Web Service

이는 스탯캐스트 자체로  생성된 데이터의 체계적인 관리 뿐만 아니라, AWS의 인공지능(Artificial Intelligence) 서비스인 아마존 세이지메이커(Amazon Sagemaker) 이용해 경기 생성된 막대한 데이터들에 대한 면밀하고 심도 있는 분석을 동시에 진행하게 된다. 따라서 이를 기반으로 선수들의 플레이 예측, 가치 평가에도 활용될 예정이라고 한다.

techNeedle 인사이트

이미 AWS는 MLB 뿐만 아니라, 다른 스포츠에서도 인공지능 데이터 분석의 영역을 확장해 왔다. 풋볼 리그(NFL) 이미 2017 부터 아마존 서비스가 제공하는 인공 지능 서비스인 넥스트 스탯(Next Gen Stats)으로 경기와 선수의 플레이를 분석해 왔고, 자동차 레이싱의 최고봉 포뮬러 1 (Formula 1) 경우 지난 6 아마존 웹서비스와 공식 클라우드 인공지능 서비스 계약을 체결했다. 미국에는 프로 스포츠 종류가 워낙 다양한 만큼, 데이터 분석 기술에 대한 수요도 확대될 것으로 예상한다.

스포츠 분야에서도 데이터는 소중한 자산이 되어 가고 있는 같다. 특히 어제 LA 다저스의 류현진 선발 경기에 간간히 등장했던 스탯캐스트 데이터들을 보면서, 촬영 기술의 발전으로 MLB 경기 발생하는 모든 상황을 데이터화 있다는 점이 신기했다. 또한 이를 인공지능과 접목해 선수의 플레이 나아가 게임 자체를 전문적으로 분석, 예측하려 노력하는 점은 더욱 놀라웠다.

관련 기사 및 이미지 출처 : Business Wire, Amazon Web Service, Youtube, MLB.com, Trackman, Chyronhego

미국 노스웨스턴 대학 켈로그 MBA 졸업 후, 현재 뉴욕의 헤지펀드에서 일하고 있습니다. 이전엔 한국에서 주식운용 펀드매니저로 일했습니다. 산업 생태계와 라이프 스타일의 좀 더 나은 발전을 위한 다양한 기술 혁신, 그리고 이를 뒷받침 하는 모든 투자 활동에 관심이 많습니다. 개인적인 블로그 JHK’ blog 를 운영 중입니다.