logo
“카나나, 연내 다국어 음성모델 확장”…카카오, 에이전틱 AI 주도권 강화
IT/바이오

“카나나, 연내 다국어 음성모델 확장”…카카오, 에이전틱 AI 주도권 강화

조민석 기자
입력

카카오의 차세대 인공지능(AI) 모델 ‘카나나’가 다국어 음성 인식 기술을 앞세워 산업 내 AI 경쟁 구도를 새롭게 그리고 있다. 카카오는 올해 안에 기존 한국어, 영어 외에도 일본어, 중국어, 베트남어 등 모두 5개 언어로 음성모델 지원을 확대할 계획이다. AI가 사용자 서비스에 실제로 적용되는 영역이 확대되면서, 카카오는 추론 및 처리 속도 개선, 다중 지시 처리, 외부 도구 연결 등 에이전틱 AI 핵심 역량 강화에 집중하고 있다. 업계에서는 이번 발표를 ‘국내 AI 플랫폼의 다국어·자율화 경쟁 신호탄’으로 분석한다.

 

카카오 김병학 성과리더는 24일 카카오AI캠퍼스에서 향후 카나나 모델 개발 전략을 공개하며, 복잡한 명령 이해력, 신속한 문제 해결, 허위정보 최소화 등 글로벌 최고 수준 역량을 목표로 카나나 2.0을 준비 중이라고 밝혔다. 카나나 2.0은 인스트럭트(instruct) 모델과 추론 도구(inference) 모델을 통합한 하이브리드 언어모델로, 카카오의 서비스 특화형 AI로 진화한다. 특히 카카오는 챗봇을 넘어, 사용자의 상황을 먼저 파악해 능동적으로 솔루션을 제시하는 ‘에이전틱 AI(Agentic AI)’ 상용화에 방점을 찍고 있다.

기술적 측면에서는 멀티모달(텍스트, 음성, 이미지 등 다중 데이터 유형)에서 추론·생성 능력을 동시 고도화하고 있다. 예컨대, ‘카나나 콜라주’는 이미지 생성, ‘카나나 키네마’는 동영상 생성까지 지원해 카카오톡 내 숏폼 콘텐츠 생성과 공유 경험을 높일 수 있다. 카나나 키네마에는 인물 포즈 제어, 생성 속도 최적화 등 최신 AI 처리 기술이 적용됐다. 기존 AI 음성모델은 한국어와 영어만 가능했으나, 연내 일본어, 중국어, 베트남어를 추가해 총 5개 언어로 확대된다.

 

경쟁 측면에서 카카오는 에이전틱 AI 기반 서비스 체제를 국내 시장에서 빠르게 현실화하고 있다. 글로벌 빅테크와의 경쟁력 측면에서는 맞춤형 모델과 카카오톡 등 자체 플랫폼의 방대한 사용자 데이터를 활용해 차별화를 노리고 있다. 해외 주요 AI 기업들은 대규모 언어모델의 다국어 지원과 API 개방에 집중하는 가운데, 카카오는 서비스 융합형 자체 모델 개발로 전략을 차별화했다.

 

정책·현장 적용 측면에서도 눈길을 끈다. 카카오는 소프트웨어 개발 전 과정에서 AI 도입을 확대(코드 품질·테스트·릴리즈·모니터링 등 SDLC 재설계)하고, 실제 개발자가 AI 툴 활용 경험을 넓히기 위한 ‘AI 마일리지 프로그램’을 운영 중이다. 참여 개발자 98%가 개발 리드타임 단축을, 89%가 프로젝트 품질 향상을 체감한 것으로 조사됐다.

 

산업계 전문가들은 카카오의 카나나 프로젝트가 실제 서비스 혁신과 문화적 파급에서 새로운 국면을 예고한다고 본다. 카카오 정규돈 CTO는 “AI를 단순 도구가 아닌 기술적 파트너로 받아들이는 ‘AI 네이티브 개발자’가 산업 전반에서 부상하고 있다”며 “AI의 역할 확장과 맞춤형 협업이 플랫폼 경쟁의 질을 좌우할 것”이라고 전망했다. 산업계는 카카오의 AI 모델이 실제 시장 도입과 사용자 경험 혁신으로 이어질지에 주목하고 있다.

조민석 기자
share-band
밴드
URL복사
#카카오#카나나#에이전틱ai