“한국어 특화 번역 LLM”…야놀자, 이브 로제타 공개로 산업 변화 예고
야놀자가 자체 개발한 번역 특화 인공지능 거대언어모델(LLM) ‘이브 로제타(EEVE ROSETTA)’를 오픈소스 AI 플랫폼 ‘허깅페이스’를 통해 1일 공식 공개했다. 이번에 내놓은 이브 로제타는 한국어에 최적화된 LLM 모델로, 기존 산업 표준보다 경량화에 성공하고 번역 및 자연어 처리 정확도를 끌어올렸다는 점에서 IT 업계의 주목을 받고 있다. 야놀자 연구개발 조직이 진행한 ‘가장 효율적이고 효과적인 단어의 확장’ 프로젝트의 핵심 산물로, 텍스트 생성, 콘텐츠 요약, 언어 번역, 감성 분석 등 다양한 자연어 처리(NLP) 기능을 단일 플랫폼에 통합했다.
이브 로제타는 출시 직후 한국지능정보사회진흥원(NIA)이 뽑은 ‘올해의 한국어 LLM’에 선정됐으며, 허깅페이스 한국어 리더보드 및 호랑이 리더보드에서 모두 1위를 차지했다. 특히 야놀자가 오픈 소스로 공개한 점과 함께, 기존 LLM 대비 파라미터(매개변수) 수를 40억 개로 줄여 운영·추론 비용을 크게 낮췄다. 초기 모델인 이브 1.0(108억개 이상)이나 시장의 일반 번역 LLM(70억개 이상)보다 효율적이라는 평가다. 경량화로 인해 일반 PC 환경에서도 무리 없이 작동하는 한편, 영어·중국어·한국어 외에도 10여 개 언어 간 번역을 지원하며, 기업과 개인 개발자 등 누구나 상업적으로 사용할 수 있는 라이선스를 제공한다.

기술적으로 이브 로제타는 ‘디코더 전용 언어모델’ 구조를 채택했다. 번역 대상을 문맥·뉘앙스·감정·의미 단위로 사전 판단하고 처리한 뒤 매끄러운 번역 결과를 산출하는 것이 강점이다. 복잡한 데이터 구조에서도 자연스럽고 명확한 결과를 생산하면서, 기존 영어·중국어 위주 번역 LLM의 한계를 실질적으로 보완했다. 운영 비용 감축과 품질 개선을 동시에 구현했다는 평이다.
야놀자는 클라우드·여행·커머스·헬스케어 등 B2B·B2C 영역까지 ‘데이터 보존형 번역 인프라’로서의 이브 로제타 활용 가능성에 주목하고 있다. 다른 대형 글로벌 기업들도 AI 번역 LLM 상용화에 박차를 가하는 가운데, 야놀자의 오픈소스 공개 전략은 국내외 번역·자연어 AI 경쟁 구도에 적지 않은 영향을 미칠 것으로 전망된다.
LLM 오픈소스 개방과 공개 라이선스 제공으로 국내 규제 장벽에 제약 없이 다양한 기관, 기업, 개발자들이 산업 현장에 빠르게 적용할 수 있다는 점도 실효성을 높인다. 해외 주요 기업 역시 Huggingface 플랫폼을 통한 모델 공개, 커뮤니티 기반 협업을 가속화하고 있어 국제 기술 표준 경쟁도 심화하는 모습이다.
이준영 야놀자그룹 CTO는 “이브는 산업 현실을 겨냥한 핵심 디지털 전환 인프라”라며 “한국어를 시작으로 일본어, 중국어 등 다국어 버티컬AI까지 확장할 계획”이라고 밝혔다. 전문가들은 향후 오픈소스 번역 LLM이 여행, 커머스, 의료 데이터 등 국내외 주요 시장에서 실사용을 확대함에 따라, 산업 패러다임 전환의 분기점이 될 것으로 보고 있다.
산업계는 이번 기술이 실제 시장에 안착할 수 있을지 주시하고 있다.