“챗봇 AI, 수학 올림피아드 금메달 획득”…딥마인드, 추론능력 새 기준 제시
챗봇 기반 인공지능(AI)이 수학 영역에서 인간의 한계를 넘어섰다. 구글 자회사 딥마인드가 개발한 대화형 AI 시스템이 국제수학 올림피아드에서 고등학생 금메달 수준의 성적을 기록하면서 산업계와 학계가 AI 추론 기술의 새 패러다임에 주목하고 있다. 실제로 올해 호주에서 개최된 대회에서 딥마인드의 챗봇 AI는 6개 출제 문제 중 5개를 풀며 기계 최초로 금메달 기준을 달성했다. 업계는 이번 발표를 ‘자연어 AI의 본격 진화’이자, 인간 수준 추론 경쟁의 분수령으로 해석하고 있다.
딥마인드의 금번 성과는 챗봇 방식의 AI가 공식 대회의 복잡한 수학 문제를 문장 그대로 읽고, 해석과 풀이까지 독자적으로 수행한 데 의미가 있다. 주요 성적은 발표 이틀 전 오픈AI 연구자 역시 유사한 성적을 비공식적으로 제시했을 만큼 글로벌 AI 업계에서 고도화된 자연어 추론 연구가 본격화된 흐름을 반영한다.

기존 AI 수학시스템은 알파지오메트리, 알파프루프 등 특화 모델을 사용해왔으나, 이들은 수학 전용 프로그래밍 언어로 문제를 번역해야만 해결이 가능했다. 반면, 딥마인드가 금번에 투입한 ‘제미니 딥 싱크’ 추론 챗봇은 자연어로만 제시된 문제를 이해~풀이~답안 도출 전 과정을 인간과 동일하게 수행했다는 점이 차별점이다.
이 시스템은 인터넷에서 확보한 방대한 텍스트 데이터를 기반으로, 시행착오를 축적하는 ‘강화학습’ 기법을 활용한다. 기존 모델 대비 언어 독립성이 높아, 결과 산출까지 별도의 번역 작업이 필요하지 않았다. 또한 4시간 반에 걸친 문제 풀이 속도 역시 고등학생 참가자와 동등한 수준을 기록해, 추론 AI의 실제 적용 가능성을 크게 높였다.
AI가 고등 수준의 수학 문제를 인간처럼 푸는 기술은 연구·교육·산업계 등 다양한 분야에서 파급력이 기대된다. 복잡한 수식은 물론, 언어 로직까지 필요로 하는 문제 해결 능력을 AI가 충분히 재현하게 된 것이다. 전문가들은 해당 기술이 수학 외 과학, 공학, 법률 등 언어와 논리적 추론이 핵심인 분야로 확장 적용될 수 있다는 점에 주목하고 있다.
글로벌 비교 측면에선 최근 오픈AI 역시 챗봇을 수학 대회에 맞춰 고도화하는 등 세계 AI 선도기업 간 경쟁이 심화되는 추세다. 아직 AI가 공인 대회에 공식 출전하는 단계는 아니지만, 문제 풀이 및 학습 효율에서 기존 모델 대비 목표 달성력이 크게 진화한 것으로 평가된다.
한편 추론형 AI의 대량 학습과정에는 높은 계산 비용과 전력 소모 등 산업적 과제가 남아 있다. 딥마인드도 4시간 반 소요라는 점을 공개했으나, 문제 풀이에 투입된 자원·비용에 대해서는 밝히지 않았다. 이는 앞으로 AI의 효율성 및 실제 서비스 적용 단계에서 중요한 이슈가 될 전망이다.
싱가포르국립대 수리과학원 관계자는 “AI가 올림피아드 금메달 수준에 도달한 것은 추론 인공지능 연구의 굵직한 이정표”라며 “장기적으로 고차원 창의 문제, 심층 논리에 AI가 접근하는 계기가 될 수 있다”고 진단했다. 산업계는 고도화된 챗봇 기반 AI가 실제 연구·교육 시장에 안착할 수 있을지 주의 깊게 지켜보고 있다.