“제미니3가 다 앞선다”…구글, 챗GPT 추월 성능으로 AI 판도 흔든다
생성형 인공지능 경쟁이 한층 격화되는 가운데 구글이 새로 공개한 대규모 언어모델 제미니3가 주요 벤치마크 테스트에서 챗GPT와 앤스로픽 등 경쟁 모델을 상회한 것으로 평가되면서 AI 판도 재편 가능성이 부각되고 있다. 텍스트와 이미지, 오디오, 비디오, 코드까지 아우르는 멀티모달 성능을 크게 끌어올리면서 검색, 클라우드, 생산성 도구 전반에 걸친 파급력에 업계 시선이 쏠린다. 월가에서는 이번 발표를 구글이 뒤처졌던 생성형 AI 경쟁을 뒤집을 분기점으로 보는 흐름이 강해지고 있다.
구글은 지난 주말 제미니3를 공개하고, 출시와 동시에 자사 검색 서비스에 새 모델을 통합했다. 구글이 신형 AI 모델을 검색에 첫날부터 연결한 것은 처음이다. 제미니3는 전문지식, 논리 퍼즐, 수학 문제, 이미지 인식 등을 포함한 12개 이상, 총 20개 수준의 벤치마크 시험에서 최신 챗GPT와 앤스로픽 모델을 상대적으로 크게 앞선 점수를 기록한 것으로 알려졌다. 미국 월스트리트저널은 업계와 투자자 평가를 인용해 제미니3가 현재까지 공개된 모델 가운데 가장 뛰어나다는 평가를 받고 있다고 전했다.

클라우드 콘텐츠 관리 기업 박스의 아론 레비 최고경영자는 정식 출시 전 제미니3 접근 권한을 부여받아 복잡한 대량 문서 분석 능력을 시험했다. 그는 결과를 확인한 뒤 성능 개선 폭이 너무 커 처음에는 시스템 오류를 의심했다고 밝혔다. 모펫내선슨의 마이클 네이선슨 애널리스트 역시 구글을 현재 AI 경쟁의 승자로 규정하며 기술 격차를 긍정적으로 평가했다.
기술적으로 제미니3는 텍스트, 이미지, 오디오, 비디오, 코드를 모두 처리하는 멀티모달 구조를 기반으로 한다. 구글 개발진은 특히 인간 수준에 가까운 사고와 추론 능력, 그리고 복잡한 코드 이해와 작성 능력에 초점을 두고 모델을 설계했다. 그 결과 다양한 영역의 시험에서 경쟁 모델을 상회했고, 코딩 성능을 측정하는 단일 벤치마크에서도 앤스로픽의 클로드 소넷 4.5에 이어 두 번째로 높은 점수를 기록했다. 다만 코딩 특화 영역에서는 아직 클로드가 근소한 우위를 유지하는 양상이다.
제미니3의 추론 능력을 검증하기 위해 구글이 활용한 대표적인 벤치마크 가운데 하나가 벤딩 벤치 테스트다. 이 시험은 AI에게 가상의 자판기 운영을 맡기고 일정 기간 동안 재고를 추적하고, 주문을 넣고, 가격을 설정하면서 수익을 극대화하도록 요구한다. 단순 질의응답을 넘어 장기간의 계획 수립과 의사결정, 환경 변화에 따른 전략 조정 능력을 측정하는 시험에서 제미니3가 특히 높은 성과를 보였다는 설명이다. 툴시 도시 구글 제품 관리 담당 선임 이사는 이 결과가 내부에서도 가장 놀라운 성취였다고 평가했다.
사용자 경험 측면에서도 멀티모달 특성이 두드러진다. 로비 스타인 구글 검색 제품 담당 부사장은 7살 딸에게 비행기 양력 개념을 설명하기 위해 제미니3를 활용했다. 텍스트 설명을 예상했지만, 제미니3는 날개 위로 기류가 흐르는 인터랙티브 시뮬레이션을 생성해 날개 각도와 기류를 직접 조정하며 비행기가 뜨는 과정을 체험할 수 있도록 했다. 그는 이런 방식이 질문 의도에 가장 적절한 답변 형태였다고 평가하며, 교육과 검색 경험 전반을 바꿀 수 있다는 확신을 갖게 됐다고 말했다.
시장성 측면에서 제미니는 아직 챗GPT에 뒤처진다. 오픈AI는 최근 챗GPT 주간 사용자가 8억 명에 이르렀다고 밝혔고, 구글의 제미니는 월간 약 6억5000만 명을 확보한 상태다. 코드 생성 영역에서는 앤스로픽의 클로드가 여전히 최고 수준이라는 평가를 받는다. 그럼에도 제미니3가 다수의 범용 벤치마크에서 경쟁 모델을 추월하면서 업무 자동화, 문서 분석, 검색, 교육, 미디어 제작까지 다양한 분야에서 기본 도구로 채택될 가능성이 커지고 있다는 분석이 나온다.
글로벌 경쟁 구도에서도 구글의 전략 변화가 감지된다. 구글은 챗GPT가 3년 전 시장을 뒤흔든 이후 생성형 AI 경쟁에서 뒤처졌다는 평가를 받아왔고, 이 과정에서 세르게이 브린 공동 창업자가 AI 개발을 직접 감독하기 위해 사실상 경영 일선으로 복귀했다. 지난 5월 연례 개발자 행사에서 AI 모드를 통합한 새 검색 엔진을 선보이면서 검색 질의에 챗봇 스타일로 응답하는 기능을 도입했고, 이를 기점으로 월가 투자자들이 구글의 AI 전략을 다시 긍정적으로 보기 시작했다.
사용자 기반 확대도 빨라졌다. 구글은 지난 8월 이미지 생성 AI인 나노 바나나를 선보인 뒤 제미니 기반 서비스 전반에 대한 수요가 늘었다. 제미니 월간 사용자는 7월 4억5000만 명에서 8월 6억5000만 명으로 급증했다. AI 중심의 검색과 생산성 도구 전략이 매출에도 반영되면서, 구글 모회사 알파벳은 지난달 분기 매출 신기록을 공개했다.
규제 환경은 여전히 변수다. 9월 미국 연방법원은 구글의 검색 시장 독점이 불법이라는 판결을 내리면서도, 검색과 정보 탐색 시장에서의 경쟁 구도가 이미 AI를 중심으로 바뀌고 있다며 제재 수위를 완화했다. 법원 판단 자체가 생성형 AI 도입이 시장 구조를 재편하고 있다는 점을 간접적으로 인정한 셈이다. 구글이 검색에 AI를 더 깊이 통합할수록 개인정보 보호, 검색 결과 편향, 광고 비즈니스 구조 변화에 대한 규제 논의가 강화될 가능성도 크다.
이와 동시에 금융 시장에서의 평가는 우호적이다. 구글 주가는 올해 들어 50퍼센트 이상 상승했고, 여름 이후로만 60퍼센트 넘게 올랐다. 알파벳의 시가총액은 최근 3조6000억 달러를 기록하며 약 7년 만에 처음으로 마이크로소프트를 넘어섰다. 투자자들이 제미니3를 포함한 AI 전략을 장기 성장 동력으로 받아들이고 있음을 의미한다.
업계에서는 제미니3가 실제 기업 업무 프로세스와 소비자 서비스 속에 얼마나 빠르게 안착하는지가 향후 AI 경쟁의 핵심 변수가 될 것으로 본다. 챗GPT가 여전히 대중적 인지도와 생태계 측면에서 앞서 있지만, 구글이 검색과 클라우드, 안드로이드 등 보유 플랫폼 전반에 제미니3를 일괄적으로 녹여낼 경우 경쟁 구도는 다시 요동칠 수 있다. 산업계는 제미니3가 보여준 기술적 도약이 실제 시장 점유율 변화로 이어질지, 그리고 AI 중심의 새로운 검색과 콘텐츠 소비 방식이 어떤 비즈니스 모델을 만들어낼지 지켜보고 있다.
