logo
“AI 한국어 멀티모달 성능 혁신”…SK텔레콤, LLM 문서 해석·VLM 모델 확대
IT/바이오

“AI 한국어 멀티모달 성능 혁신”…SK텔레콤, LLM 문서 해석·VLM 모델 확대

강예은 기자
입력

초거대언어모델(LLM)과 멀티모달 인공지능(VLM) 기술이 한국 AI 산업의 경쟁 구도를 새롭게 그리고 있다. SK텔레콤이 29일 공개한 ‘에이닷 엑스(A.X)’ 기반의 인코더 및 시각-언어모델 신제품은 LLM 학습 과정과 산업 응용에서 글로벌 수준의 성능을 입증하며, AI 생태계 확장에 주목을 받고 있다. 업계는 “AI 멀티모달·문서 해석 능력이 본격적으로 상용화 국면에 진입한 신호탄”이라는 평을 내놓는다.  

 

SK텔레콤은 오픈소스 커뮤니티인 허깅페이스를 통해 ‘A.X Encoder’와 ‘A.X 4.0 VL Light’ 등 자체 개발 AI 모델 2종을 공개했다. 이로써 지난 7월 대규모 학습(CPT) 기반 A.X 4.0 2종, 프롬스크래치 학습의 A.X 3.1 2종에 이어, 총 6종의 LLM·VLM 라인업을 완성했다. 이번에 공개된 A.X Encoder는 1억4900만개 매개변수로 작동하며, 국내 ‘RoBerTa-base’(80.19점·KLUE 기준)를 웃도는 85.47점의 자연어 이해 성능을 기록했다. 한국어 특화 인코더로 긴 문서(최대 1만6384토큰)도 신속하게 처리, 학습·추론 효율성에서 기존 상용 모델 대비 최대 3배 속도를 구현했다.  

함께 공개된 ‘A.X 4.0 VL 라이트’는 70억개 매개변수 기반의 중형 멀티모달(시각-언어 결합) 모델이다. 한국어, 기업현장 도면·표·그래프 등 다양한 입력 데이터에 대응해, 표준 벤치마크(K-Viscuit 80.2점, KoBizDoc 89.8점)에서 글로벌 주류 대형모델(Qwen2.5-VL32B)보다 개선된 성능을 보였다. 텍스트 처리 토큰도 Qwen2.5-VL32B 대비 41% 적게 소모됨으로써 AI 도입 비용 효율화에도 기여할 가능성이 높다.  

 

특히 SK텔레콤은 이번 모델들을 산업계와 학계가 자유롭게 활용할 수 있도록 오픈소스로 공개, 한국어 AI 생태계 내 중소기업·스타트업 접근성을 크게 높였다. 한글 멀티모달 데이터셋 처리, 복잡한 문서와 도표 자동해석, 제조 현장·금융·의료 분야 등 한국 실정에 특화된 AI 적용 확대가 기대된다.  

 

글로벌 시장에서는 이미 오픈AI, 메타, 구글이 다국어·멀티모달 기반 자체 LLM 기술 경쟁을 벌이고 있다. SK텔레콤의 시도는 국내에서 대형 AI를 직접 개발·상용화하는 대표 사례로, 기술 독립 확보와 엑소더스 현상 차단의 측면에서도 의미가 크다.  

 

LLM 기술의 산업 내 본격 확산을 위해선 투명한 알고리즘 성능 평가, 데이터 편향 완화, 개인정보 보호 등 다층적 이슈에 대한 대비가 필수로 보인다. SK텔레콤 역시 컨소시엄 구축과 산학연 협력 확대, 정부 차원의 AI모델 신뢰성 인증 체계 마련 등 개방형 생태계 전략을 병행하고 있다.  

 

김태윤 파운데이션 모델 담당은 “독자 기술력은 소버린 AI의 핵심”이라며 “글로벌 최고 AI 경쟁력 확보에 속도를 내겠다”고 밝혔다. 전문가들은 대형 LLM의 상용화와 문서처리·멀티모달 고도화가 국내 AI 산업 지형을 바꿀 분수령이 될 것으로 전망한다.  

 

산업계는 이번 SK텔레콤의 AI 기술이 실제 산업 현장과 글로벌 오픈소스 생태계에 연착륙할지 예의주시하고 있다. 기술-윤리, 생태계 주도권과 제도 간 균형 확보가 새로운 경쟁 패러다임으로 부상하고 있다.

강예은 기자
share-band
밴드
URL복사
#sk텔레콤#a.x4.0vl라이트#오픈소스