“네이티브옴니모달 AI”…네이버, 하이퍼클로바X로 마음케어까지
네이버클라우드가 자체 초거대 인공지능 하이퍼클로바X의 차세대 모델을 공개하며 K AI의 기술 경쟁력과 활용 영역을 한층 넓히고 있다. 텍스트와 이미지, 오디오를 동시에 학습한 네이티브 옴니모달 구조와 수능 상위 1등급 수준의 고성능 추론 역량을 앞세워 일상 생활의 마음 케어부터 금융·에너지·농업 등 산업 현장까지 파고드는 전략이다. 업계에서는 네이버가 소버린 AI와 풀스택 AI 밸류체인 구성을 통해 글로벌 초거대 AI 경쟁에서 존재감을 강화하고 있다는 분석이 나온다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 30일 서울 코엑스에서 열린 독자 AI 파운데이션 모델 프로젝트 1차 발표회에서 국내 최초 네이티브 옴니모달 구조를 적용한 파운데이션 모델 하이퍼클로바 X 시드 8B 옴니와 고성능 추론모델 하이퍼클로바 X 시드 32B 씽크를 공개했다. 네이버클라우드는 독자 AI 파운데이션 모델 프로젝트가 종료되는 2027년까지 성능과 효율성, 실용성을 지속 고도화해 하이퍼클로바X를 발전시키겠다는 계획을 제시했다.

옴니모달 AI는 하나의 모델이 텍스트, 이미지, 오디오처럼 서로 다른 형태의 데이터를 동시에 이해하고 생성하도록 설계된 인공지능을 뜻한다. 지금까지는 이미 학습된 거대 언어모델에 이미지나 음성 등 별도 모델을 사후 결합하는 방식이 일반적이었다. 성 총괄은 하이퍼클로바 X 시드 8B 옴니에 대해 텍스트, 이미지, 오디오를 처음부터 동시에 학습한 네이티브 옴니모달 구조라고 강조했다. 사용자는 음성, 이미지, 텍스트 중 어떤 방식으로 질문하더라도 실시간으로 유연한 상호작용이 가능해지며, 다중모달 환경에서 자연스러운 대화 경험을 제공하는 방향으로 설계됐다.
하이퍼클로바 X 시드 32B 씽크는 기존 텍스트 중심 추론형 AI에 시각, 음성, 도구 활용 역량을 결합한 모델이다. 특히 이미지를 깊이 있게 이해하는 능력을 갖춰, 사용자가 수학 문제를 사진으로 찍어 올리면 그래프가 포함된 복합 문제도 5초 내에 풀이 과정과 정답을 제시하도록 구현됐다. 성 총괄은 이 모델이 대학수학능력시험에서 국어, 영어, 수학 1등급, 한국사와 영어 영역 만점을 기록하는 수준의 성능을 보였다고 설명하며, 훨씬 큰 규모의 초거대 모델에 견줘도 문제 해결력은 비슷한 수준이면서 개발과 운용 비용 측면에서는 더 효율적이라고 평가했다.
새로운 모델을 활용한 서비스 데모도 공개됐다. 하이퍼클로바 X 시드 8B 옴니 기반 AI 마음케어는 음성 대화를 중심으로 사용자의 정서 상태를 파악하고 공감형 응답을 제공하는 상담형 서비스다. 감정 표현과 맥락 파악 능력을 결합해 위로와 조언을 건네는 방향으로 설계돼, 정신 건강 관리와 일상 고민 상담 등으로 활용 폭이 넓어질 수 있는 구조다. 보이스 스타일러는 지역별 사투리와 다양한 언어를 인식·변환해 다국어 통역과 음성 스타일 변환을 제공하는 서비스이고, 스타일 스튜디오는 입력된 이미지를 다양한 시각적 스타일로 재가공하도록 하는 이미지 생성·편집 서비스다.
취약 계층을 겨냥한 접근성 연구도 병행한다. 네이버클라우드는 발화를 하지 못하는 아동을 위해 액세스 톡 서비스를 개발 중이라고 밝혔다. 이 서비스는 부모에게 상황별 질문 가이드를 제공하고, 아이에게는 그림 카드 인터페이스를 제시해, 발화 대신 선택을 통해 의사 표현을 돕는 방식이다. 옴니모달 AI를 기반으로 비언어적 표현을 구조화해 대화의 첫 마디를 열어주는 것이 핵심으로, 디지털 헬스케어와 특수 교육 분야에서의 활용 가능성이 주목된다.
산업별 특화 AI 전략도 확대한다. 네이버클라우드는 이미 한국은행, 한국수력원자력과의 협업을 통해 금융·에너지 분야 특화 AI를 구축한 경험을 바탕으로 광산, 주거, 음악, 제조, 유통 등으로 버티컬 AI 포트폴리오를 넓힌다는 구상이다. 발표회에서 소개된 농업 전문 기업과의 협업 사례에서는 AI 음성 기술로 영농 일지를 자동 작성하고, 음성 명령으로 농기계를 제어하며, 수집된 데이터를 분석해 농기계 관리와 작업 경로를 최적화하는 서비스가 공개됐다. 이러한 구조는 노동력 부족과 고령화 문제에 직면한 농업 현장에서 생산성 향상 수단으로 활용될 여지가 크다.
공공 영역에서는 포용적 AI 전략을 내세운다. 네이버클라우드는 내년 2월 행정안전부와 함께 공공 에이전트 시범 서비스를 네이버 톡톡에서 선보일 예정이다. 초기에는 전자증명서 발급 절차를 안내·대행하는 에이전트와 공공시설 예약을 돕는 에이전트를 제공하고, 상반기에는 여러 민원 업무를 하나의 창구에서 처리하는 AI 민원통합 에이전트로 확대하는 로드맵을 제시했다. 공공 서비스에 대화형 AI를 접목해 민원 처리 접근성을 높이고 행정 효율을 개선하려는 시도로 해석된다.
네이버클라우드는 이번 프로젝트를 자국 데이터센터와 자체 AI 모델, 서비스 플랫폼을 망라하는 소버린 AI 전략의 연장선으로 설명했다. 성 총괄은 네이버클라우드가 소버린 AI 개념을 처음 제시한 회사라고 강조하며, 국가 차원의 AI 주권 확보를 위해 인프라와 모델, 서비스까지 한국 환경에 맞게 구축해 왔다고 말했다. 이어 데이터 센터 운영부터 AI 서비스 제공까지 이미 풀스택 AI 밸류체인을 확보했으며, 일본, 태국, 사우디아라비아 등 해외로 활동 범위를 넓혀 각국의 과제에 맞는 AI 기반 해결책을 함께 찾고 있다고 덧붙였다.
연구·인재 생태계 조성 측면에서도 움직임이 이어진다. 네이버클라우드는 국내 5개 대학 및 연구기관과 산학협력 에이전시 포럼을 운영하며 초거대 AI를 연구하고 활용할 수 있는 전문 인력을 양성하는 데 힘을 싣고 있다고 밝혔다. 초거대 모델을 다룰 수 있는 인재 풀 확보는 장기적인 기술 경쟁력과 직결되는 만큼, 모델 성능 고도화 계획과 맞물린 전략적 투자로 풀이된다.
업계에서는 네이버클라우드가 네이티브 옴니모달 구조와 고효율 추론 모델을 앞세워 일상과 산업·공공 영역을 동시에 겨냥하는 전략을 가속하며 글로벌 빅테크와의 기술 격차를 좁혀가고 있는지에 주목하고 있다. 동시에 소버린 AI와 풀스택 밸류체인의 성패가 K AI의 지속 성장을 좌우하는 핵심 변수로 떠오르면서, 인프라·제도·윤리 기준을 함께 정비하는 움직임이 향후 경쟁력의 분수령이 될 것이라는 관측도 제기된다.
