카카오 카나나2 오픈소스 공개…추론 특화로 에이전트 경쟁 점화
오픈소스 대형언어모델 경쟁이 에이전트 시대를 향해 재편되고 있다. 카카오는 19일 차세대 언어모델 카나나2를 공개하며 추론 특화 모델을 포함한 풀 라인업을 허깅페이스에 올렸다. 긴 문맥 처리와 도구 호출, 다국어 지원을 강화해 실제 서비스형 AI 에이전트에 바로 투입할 수 있는 실용성을 내세웠다. 업계에서는 카나나2가 큐웬3급 성능과 오픈 가중치를 동시에 확보한 만큼, 국내 기업의 오픈소스 LLM 전략이 본격적인 글로벌 경쟁 국면에 들어섰다는 관측이 나온다.
카카오는 지난해 자체 모델 카나나를 선보인 이후 경량 모델부터 고난도 문제 해결에 특화된 카나나1.5까지 순차적으로 공개해 왔다. 이번에 발표한 카나나2는 성능과 효율을 동시에 끌어올린 차세대 연구 결과물로, 사용자 지시의 맥락을 세밀하게 파악하고 능동적으로 작업을 이어가는 동료형 AI 구현에 초점을 맞췄다.

카나나2는 베이스, 인스트럭트, 추론 특화 등 세 가지 모델로 구성된다. 베이스는 대규모 사전학습을 마친 기본 언어모델이고, 인스트럭트는 사후 학습을 통해 사용자 지시 이행 능력을 높인 버전이다. 새로 추가된 추론 특화 모델은 수학, 논리, 코딩 등 복잡한 사고 과정이 필요한 과제에서 강점을 보이도록 설계됐다. 카카오는 세 모델 모두 학습 단계에서 사용한 웨이트를 전면 공개해, 개발자와 연구자가 자체 데이터로 자유롭게 파인튜닝할 수 있도록 했다. 이는 상용 서비스와 연구용 실험 모두에 활용 범위를 넓히는 전략으로 해석된다.
카나나2의 핵심 변화는 에이전틱 AI로 불리는 도구 활용형 에이전트 구현 능력이다. 카카오는 카나나1.5 32.5b 모델과 비교해 다중 대화 도구 호출 능력이 3배 이상 향상됐다고 밝혔다. 복잡한 단계별 요구사항을 세분화해 이해하고, 외부 검색·계산·내부 API 호출 등 여러 도구를 순차 또는 병렬로 조합하는 기능이 강화된 것이다. 지원 언어도 기존 한국어와 영어 중심에서 한국어, 영어, 일본어, 중국어, 태국어, 베트남어 등 여섯 개 언어로 넓혀 다국어 환경의 글로벌 서비스 적용 폭을 키웠다.
모델 아키텍처 측면에서는 효율성 극대화가 핵심 키워드다. 카카나는 긴 입력을 효율적으로 처리하는 MLA 기법을 도입해 수만 토큰에 이르는 장문 문맥을 적은 메모리로 다룰 수 있게 했다. 여기에 전문가혼합 구조를 적용해, 추론 과정에서 전체 파라미터 대신 필요한 전문가 집합만 선택적으로 활성화되도록 설계했다. MoE는 여러 전문 하위모델을 두고 입력 유형에 따라 일부만 연산에 참여시키는 구조로, 같은 파라미터 규모에서도 실질 추론 비용을 줄이고 응답 속도를 높이는 효과를 낸다. 카카오는 이 조합을 통해 대규모 동시 접속 상황에서도 응답 지연을 크게 줄였다고 설명한다.
성능 지표에서도 글로벌 오픈소스 상위권 모델과 어깨를 나란히 했다고 강조했다. 카카오에 따르면 카나나2 인스트럭트 모델은 동일 구조의 최신 모델인 큐웬3 30B A3B와 유사한 수준의 지시 이행 성능을 달성했다. 지난 10월 한국정보과학회와 공동 개최한 AI 에이전트 경진대회에서 참가자들에게 선공개했으며, 실제 에이전트 개발 환경에서 대화 설계, 툴 연계, 시나리오 운영 등에서 경쟁력 있는 성능을 입증했다는 평가다.
추론 특화 모델도 다양한 사고 능력 벤치마크에서 추론 모드가 활성화된 큐웬3 30B A3B와 비슷한 결과를 기록했다. 이는 수학 문제 풀이, 코드 작성, 단계적 논리 설명 등 고난도 작업에서 글로벌 오픈소스 상위권 모델과의 격차를 상당 부분 줄였다는 뜻으로 해석된다. 업계에서는 카카나2가 멀티도구 에이전트, 자동화 코파일럿, 데이터 분석 어시스턴트 등 고부가가치 서비스 영역에서 국내외 기업의 선택지를 넓힐 수 있다는 전망을 내놓고 있다.
카카오는 카나나2를 시작으로 동일한 MoE 구조를 기반으로 한 모델 스케일 확장을 예고했다. 더 큰 파라미터 수와 고차원적 지시 이행 능력을 확보해, 복합 업무 의사결정과 도메인 특화 에이전트에 대응하겠다는 구상이다. 동시에 온디바이스 경량 모델 고도화도 병행해, 스마트폰과 엣지 디바이스에서 개인정보를 외부로 보내지 않고 동작하는 로컬 AI 수요에 대응할 계획이다.
국내외 LLM 시장에서는 메타의 라마3, 알리바바와 바이두의 중국어 중심 모델, 오픈AI와 앤트로픽의 상용 폐쇄형 모델까지 다양한 스펙트럼의 경쟁이 벌어지고 있다. 특히 허깅페이스를 중심으로 한 오픈소스 생태계에서 다국어와 도구 호출, 추론 성능을 모두 갖춘 모델의 확보가 플랫폼 지배력의 관건으로 거론된다. 카카나2의 등장으로 한국어 친화형이면서도 글로벌 수준의 성능을 제공하는 선택지가 늘어난 만큼, 국내 스타트업과 병원, 공공기관 등이 외산 모델 의존도를 줄이고 자체 서비스에 최적화한 AI를 구축할 여지도 커질 것으로 보인다.
김병학 카카오 카나나 성과리더는 언어모델의 성능과 효율이 혁신적인 AI 서비스의 기반이라고 강조했다. 그는 높은 정답률을 추구하는 모델을 넘어 실제 서비스 환경에서 빠르고 안정적으로 동작하는 실용성을 갖춘 모델 개발에 집중하고, 이를 지속적으로 오픈소스로 공유해 국내외 AI 연구 생태계 활성화에 기여하겠다고 밝혔다. 산업계는 카나나2가 글로벌 오픈소스 LLM 판도 속에서 어느 수준까지 실사용 사례를 확대할지 주시하고 있다.
