“GPT-4o 뛰어넘은 한국어 LLM”…SK텔레콤, A.X 4.0 오픈소스 공개
한국어 특화 인공지능(AI) 언어모델이 글로벌 표준을 뛰어넘으며 시장 판도를 바꾸고 있다. SK텔레콤이 자체 개발한 대규모 언어모델 ‘A.X(에이닷 엑스) 4.0’이 세계 최고 수준의 한국어 처리 능력과 데이터 보호 체계를 앞세워 오픈소스로 공개됐다. 회사는 이 모델이 GPT-4o 등 세계 최상위권 LLM(초거대 언어모델)과 비교해 한국 비즈니스 환경에서 경쟁력을 갖췄다고 밝혔다. 업계는 SK텔레콤의 이번 발표를 ‘국산 LLM 독립 경쟁’의 분기점으로 보고 있다.
SK텔레콤은 3일 세계적 오픈소스 커뮤니티에서 A.X 4.0의 표준 및 경량 모델 2종을 공개했다. 표준 모델은 720억개(72B), 경량 모델은 70억개(7B)의 매개변수(parameter)를 탑재해 다양한 활용 목적에 대응한다. 오픈소스 LLM Qwen2.5를 기반으로 대량 한국어 데이터를 추가 학습시켜 국내 실정에 최적화됐으며, 토크나이저(tokenizer)까지 자체 설계해 한국어 문장 이해 및 생성 효율을 극대화했다.

A.X 4.0의 핵심은 한국어 특화 성능과 데이터 보안이다. 회사 자체 평가에서는 동일한 한국어 입력 문장에서 GPT-4o 대비 약 33%의 토큰 처리 효율을 보이며, 비용·속도 측면 모두 우위를 확인했다고 밝혔다. 대표적인 한국어 벤치마크 KMMLU에서 78.3점(GPT-4o: 72.5점), 한국 문화 이해도 평가 CLIcK에서는 83.5점(GPT-4o: 80.2점)으로 모두 글로벌 모델을 상회했다. 특히 로컬 서버(온프레미스)에 직접 설치해 구동이 가능해, 기업들의 민감 데이터 보호 요구까지 충족할 수 있다는 점이 부각된다.
SK텔레콤은 실제 서비스에 해당 LLM을 적용 중이다. 지난 5월 AI 어시스턴트 서비스 ‘에이닷’의 통화 요약에 A.X 4.0 모델이 일부 적용됐고, 추후 SK그룹 내 다양한 서비스로 확대될 전망이다. KMMLU·CLIcK 등 한국어·문화 평가에서의 성능은 구글·오픈AI 등 해외 빅테크 LLM과의 격차를 이어주는 중요한 지점으로 꼽힌다.
또한 A.X 4.0은 개발 및 학습 전 과정을 SK텔레콤 자체 인프라와 데이터로 구축했다. 외부와 연동 없는 독립 구조(CPT, Complete Pre-Training)로 데이터 주권을 유지함과 동시에, 공개 범위 역시 활용 자유도가 높은 오픈소스 방식을 택했다. 기업 내부 서버에 직접 올릴 수 있도록 온프레미스 방식도 제공해, 클라우드 기반 LLM의 해외 데이터 유출 불안도 해소한다는 점이 강점이다.
SK텔레콤은 6월 내 수학 문제 풀이·코드 개발 역량이 강화된 추론형 모델과 텍스트·이미지 멀티모달 확장을 잇따라 공개할 계획이다. 프롬 스크래치(From Scratch, 처음부터 자체 설계) 방식을 적용한 A.X 3.0에 이어, 후속 모델 역시 순차적으로 개발할 방침을 밝혔다.
글로벌 생성형 AI 경쟁은 빅테크를 중심으로 다국어·문화 최적화 및 데이터 주권 요구가 맞물리며, 각국 기업들의 자체 LLM 역량 강화로 이어지는 추세다. 미국·유럽에서는 이미 국가 단위의 AI 인프라 구축이 진행 중이며, 해외시장에 비해 데이터와 언어적 특수성이 강조되는 한국에서는 이번 A.X 4.0와 같은 현지화 모델이 차별화 포인트로 지목된다.
전문가들은 “국산 LLM 개발 경쟁이 본격화되며, 데이터 보안·운영 독립성 등 기술 외적 경쟁력 역시 글로벌 시장에서 중요해지고 있다”며 “향후 AI 산업 내에서 오픈소스 LLM의 역할 확대 여부가 핵심 변수가 될 수 있다”고 진단했다. 산업계는 이번 SK텔레콤의 공개로 한국어 AI 시장 주도권 경쟁이 한층 가속화될지 주시하고 있다.