“한국어 LLM 1위”…KT, 믿:음 2.0로 언어 AI 기술력 입증
국산 생성형 인공지능(AI) 경쟁이 본격화되는 가운데, KT가 자체 개발한 초거대언어모델(LLM) ‘믿:음 2.0’이 한국어 특화 LLM 평가 플랫폼 ‘호랑이(Horangi) 리더보드’에서 국내 1위 성적을 거뒀다. 이 플랫폼은 글로벌 MLOps 전문 기업 웨이트앤바이어스(W&B)가 운영하며, 실제 한국어 환경에서의 이해도와 응답 안전성 등 다면적 실력을 객관적으로 평가하는 벤치마크로 업계의 신뢰를 얻고 있다. 업계에선 이번 결과를 한국어 LLM 경쟁의 전환점으로 본다.
KT는 4일 공개한 ‘믿:음 2.0 베이스’가 호랑이 리더보드3에서 파라미터 수 150억개 미만 국산 모델 중 종합 성능 1위(점수 0.7197)를 기록했다고 밝혔다. 세부적으로는 범용 성능 0.7004, 응답 정렬 성능 0.739를 받았다. 세계 동급 모델 기준으로도 3위다.

호랑이 리더보드는 지식 문항 답변 정확성만을 따지던 기존 시험과 달리, 작문·추론·정보 추출 등 실생활 시나리오를 기반으로 평가한다. 한국어 특유의 문맥·표현·사회 문화 맥락을 반영한 응답인지도 따진다. 평가 결과는 WanDB 플랫폼을 통해 투명하게 공개돼 직접 검증이 가능하며, 실효성과 신뢰도 측면에서 의미가 크다는 분석이다.
KT에 따르면, ‘믿:음 2.0’은 한국 사회의 다양한 지식과 생활방식, 언어습관을 학습해 ‘한국형 AI’로 설계된 점이 특징이다. 특히 외산 모델을 단순히 조정하는 방식이 아니라, 아키텍처 설계부터 데이터 수집·가공, 학습, 튜닝까지 전 과정을 직접 수행한 순수 자체 개발 모델이라는 점에서 기술력의 차별성을 더했다.
산업계에선 이번 결과가 ‘국산 AI’의 실전 경쟁력을 입증했다고 평가한다. KT는 믿:음 2.0을 바탕으로 맞춤형 B2B AI 솔루션을 다양한 산업군에 공급하고, 공공·금융·교육·법률 분야 실증 사업을 확대할 계획이다. 조만간 성능을 한층 끌어올린 믿:음 2.0 프로와, 추론·멀티모달 기능 확장 모델도 선보일 방침이다. KT는 AI 반도체 기업 리벨리온 등 국내외 파트너와 연계해 AI 생태계 구축 방안도 추진한다.
한편, 글로벌 시장에선 한국어 LLM의 기술력과 현지화 실효성이 AI 서비스 확산의 핵심 경쟁력으로 주목받고 있다. 전문가들은 “한국어 특화 AI가 디지털 산업 전반의 생산성과 질적 도약을 이끌 수 있을지 주목된다”고 진단한다. 산업계는 KT 등 국내 기업의 모델이 실제 시장에 안착할 수 있을지 지속적으로 주시하고 있다.