IT/바이오

“그록5, 페이커와 맞붙는다”…머스크, LoL AI 도전장

김태훈 기자
입력

인공지능이 e스포츠 최정상 무대까지 넘본다. 일론 머스크가 이끄는 xAI가 자사 차세대 모델 그록5를 리그 오브 레전드에 투입해 2026년 세계 최고 수준 프로팀을 꺾겠다는 목표를 세우면서다. 알파고가 바둑에서 인간 최고수를 상대로 한 대결이 인공지능 연구의 상징이 된 것처럼, 이번 프로젝트는 멀티플레이 팀 기반 게임에서 범용 인공지능 수준을 검증하는 시험대가 될 전망이다. 업계에서는 게임을 통한 복합 의사결정 학습이 향후 자율주행, 로보틱스, 전략 시스템 등으로 확산될 가능성에 주목하고 있다.

 

머스크는 25일 현지 시간 소셜미디어를 통해 그록5가 2026년 LoL 최고 인간 팀을 이길 수 있는지 시험하겠다고 밝혔다. 그록은 xAI가 개발 중인 거대언어모델 계열 브랜드로, 그록5는 2025년 1분기 출시가 목표로 알려져 있다. 머스크는 그록5가 텍스트 형태의 게임 설명서만 제공받은 상태에서 스스로 규칙을 해석하고 화면을 보며 플레이를 학습하도록 설계 중이라고 설명했다. 언어 이해와 시각 인식, 강화학습이 결합된 형태로, 특정 게임 전용 봇이 아니라 다양한 환경에 적응 가능한 범용 인공지능 수준을 지향하는 셈이다.

머스크는 대결 조건도 구체적으로 제시했다. 그록5는 모니터 화면만 입력으로 활용하며 인간과 같은 시야 제한을 갖도록 설정하고, 시력은 통상 20 대 20에 해당하는 수준, 반응 지연과 마우스 클릭 속도도 인간 프로게이머와 비슷한 범위로 맞추겠다는 계획이다. 초인적인 APM이나 전지적 시야에 의존하지 않고 전략과 판단, 팀 플레이로 승부를 보겠다는 취지다. 기술적으로는 화면 픽셀을 입력으로 받아 상황을 파악하는 비전 모델과, 게임 진행에 따라 행동을 선택하는 정책 네트워크, 장기 보상을 최적화하는 강화학습 구조가 결합될 것으로 예상된다.

 

LoL은 5 대 5 팀 기반 실시간 전략 액션 게임으로, 챔피언 선택과 조합, 라인전, 오브젝트 관리, 시야 확보, 후반 한타 운영 등 분 단위 단기 판단과 수십 분 단위 장기 전략이 동시에 요구된다. 바둑과 달리 완전한 정보가 아닌 제한된 시야와 불확실한 변수 속에서 의사결정을 내려야 하며, 팀원 네 명과의 조율도 필수다. 특히 인간 프로게이머는 상대의 심리, 메타 변화, 패치 이후 전략 전환까지 종합적으로 고려하기 때문에 AI가 이 수준을 넘어선다면 전술 추론과 협업 능력에서 중요한 성취로 평가될 수 있다.

 

머스크의 제안이 공개되자 팬들의 관심은 자연스럽게 T1으로 모였다. T1은 올해 리그 오브 레전드 월드 챔피언십에서 우승하며 대회 통산 네 번째, 3연속 우승 기록을 세운 최강 팀이다. 팀을 상징하는 미드 라이너 이상혁, 게임 아이디 페이커는 LoL 역사상 최고 선수로 불리며 전략 이해도와 한타 설계 능력에서 독보적인 평가를 받는다. T1은 머스크 글을 공유한 뒤 페이커의 대표 포즈 영상과 함께 준비됐다는 메시지를 남기며 대결 구도에 화답했고, 조 마쉬 T1 대표도 이를 인용하며 관심을 표했다.

 

AI와 게임 최고수 간 대결은 기술 검증과 대중 홍보를 동시에 겨냥하는 방식으로 자리 잡아왔다. 2016년 구글 딥마인드는 서울에서 바둑 인공지능 알파고와 이세돌 9단의 5번기를 진행했다. 알파고는 전체 전적에서 우위를 보였지만 이세돌이 네 번째 대국에서 예상 밖 수로 승리한 장면은 인간의 창의성과 전략적 직관을 상징하는 사례로 남았다. 이 과정에서 강화학습과 몬테카를로 트리 탐색을 결합한 알파고의 구조와, 인간 기보에 덜 의존하는 자가대국 기반 학습 방식이 널리 알려지면서 AI 연구에도 큰 영향을 줬다.

 

오픈AI도 2019년 도타2에서 국제 대회 우승팀 OG를 상대로 5 대 5 매치를 치렀다. 5개 에이전트로 구성된 오픈AI 파이브는 약 10개월 동안 축적한 4만5000년 분량의 자가 플레이 데이터를 통해 전술과 운영을 익혔고, 실제 경기에서 OG를 상대로 완승을 거뒀다. 다만 당시에는 특정 영웅 제한, 일부 아이템 비활성화 등 룰을 단순화해 학습 난이도를 조정한 점이 감안됐다. 이번 그록5 프로젝트가 실제 LoL e스포츠 규칙과 어느 정도 일치하는 조건으로 진행될지에 따라 기술 평가의 무게도 달라질 전망이다.

 

그록5는 언어 이해와 멀티모달 인식을 결합한 LLM 계열 모델로 알려져 있다. 게임 설명서를 텍스트로 이해하고, 이를 바탕으로 화면의 객체와 이벤트를 의미 단위로 해석해 행동 정책에 반영하는 구조가 유력하다. 프로그래밍 측면에서는 LoL 클라이언트에 직접 접속하는 대신 화면 인식과 입력 시뮬레이션을 활용하는 방식이 언급되고 있어, 실제 인간과 같은 인터페이스를 전제로 하는 연구에 가깝다. 만약 이런 방식으로 세계 정상급 팀을 상대로 경쟁력을 입증할 경우, 언어 모델이 실시간 의사결정과 복잡한 전략 게임까지 커버할 수 있다는 신호로 받아들여질 수 있다.

 

게임 AI 경쟁은 글로벌 빅테크가 AI 기술을 실전 검증하는 무대로 확대되는 분위기다. 구글 딥마인드는 바둑 이후 스타크래프트2, 포커 등에서 연구 성과를 발표해 왔고, 마이크로소프트와 메타도 강화학습 기반 멀티에이전트 시스템을 다양한 게임 환경에서 테스트하고 있다. 다만 최근에는 공개 이벤트보다는 내부 연구용 벤치마크로 활용하는 비중이 커졌다. xAI가 다시 공개 대결 방식을 선택한 것은 기술 성과를 대중적 이벤트와 결합해 브랜드를 부각시키려는 전략으로 해석된다.

 

머스크는 게임은 물론 게임 개발 과정에도 AI를 깊게 투입하려는 구상을 드러내고 있다. 지난해 AI 기반 게임 스튜디오 설립을 선언한 뒤, 내년 말까지 AI가 생성한 비디오 게임을 선보이겠다며 인력 채용에 나선 상태다. 언어 모델과 생성형 AI를 활용해 스토리와 그래픽, 레벨 디자인, 심지어는 NPC 행동까지 자동 생성하는 방향을 상정한 것으로 보인다. 그록5의 LoL 도전 역시 게임 환경 내 의사결정 역량을 극대화해 향후 완전 자동화 게임 제작의 기반 기술을 확보하려는 시도로 연결될 수 있다.

 

다만 게임 특화 AI가 상용 서비스나 산업 환경으로 바로 이어지기까지는 넘어야 할 과제도 적지 않다. e스포츠 경기와 달리 실제 산업 현장은 물리적 제약, 규제 준수, 안전 이슈 등이 얽혀 있어 강화학습으로 탐색 가능한 행동 범위가 제한된다. 데이터 수집과 실험 비용도 게임 환경보다 높다. 그럼에도 불구하고 전문가들은 복잡한 멀티플레이 게임에서 검증된 AI 의사결정 기술이 물류 최적화, 금융 리스크 관리, 네트워크 트래픽 제어 등 다수 에이전트와 불확실성이 얽힌 영역으로 확장될 가능성에 주목하고 있다.

 

국내 e스포츠 업계에서는 T1과 그록5의 맞대결이 실제로 성사될 경우 게임 산업과 AI 기술 홍보 효과가 상당할 것으로 보고 있다. 다만 경기 진행 규칙, 학습 데이터 공개 범위, 경기 환경의 공정성 확보 등 논의해야 할 점도 많다. 어떤 방식이든 인간 팀과 AI 팀이 같은 제약 조건에서 실력을 겨루는 구도가 확보돼야 기술적 의미를 인정받을 수 있다는 지적도 나온다. 산업계는 결국 이런 이벤트가 보여주는 상징성을 넘어, 게임에서 검증된 AI가 어디까지 실생활 문제 해결로 이어질지 지켜보고 있다.

김태훈 기자
share-band
밴드
URL복사
#일론머스크#그록5#t1