IT/바이오

“AI, 복잡한 음성까지 번역한다”…네이버, 실시간 멀티언어 서비스 확대

강예은 기자
입력

네이버의 인공지능(AI) 번역 서비스 ‘파파고’가 유료 구독형인 ‘파파고 플러스’에 음성 번역 기능을 새롭게 도입했다. 다양한 언어 간 실시간 소통의 허들이 낮아지면서, AI가 전문 통역사의 역할을 일부 대체할 만한 기술 단계에 접어들고 있다. 네이버클라우드는 29일 파파고 플러스에 음성 번역 업데이트를 실시했다고 밝혔다. 한국어와 영어, 일본어 등 입력 음성을 최대 15개 언어로 즉시 변환할 수 있으며, 이 과정에서 녹음·파일 업로드 등 다양한 입력 방식에 대응한다는 점이 특징이다. 업계는 이번 발표를 ‘실시간 다국어 협업 경쟁의 분기점’으로 해석한다.

 

파파고 플러스의 새 음성 번역 기술은 기존의 음성을 텍스트로 바꾼 뒤 다시 번역하는 2단계 방식과 달리, AI 모델이 음성 인식과 번역을 통합 처리한다. 이에 따라 번역 지연(latency)이 줄고 결과의 정확도도 함께 높아졌다는 평가다. 1회 최대 60분 분량 음성을 지원하면서, 장시간 외국어 강의나 비즈니스 회의에서 실시간 이해와 다국어 기록이 가능해졌다. 파파고 클라우드 책임자인 신중휘 이사는 “한국어와 영어·일본어·중국어 조합에서 파파고 음성 번역은 현재 국내외 최고의 품질”이라고 강조했다.

파파고 플러스는 음성 번역 외에도 문서·이미지 번역에서 높은 활용성을 추구한다. 번역 결과물의 파일 형식과 디자인을 유지하면서 편집이 가능하고, 이미지에서 추출한 텍스트 역시 원본 스타일을 반영해 편집할 수 있다. 기업이나 교사 등 조직 사용자를 겨냥한 협업 기능도 강화해, 최대 100명까지 팀 단위로 번역문과 용어집을 공유·활용할 수 있다. 특히 사전 등록된 용어집을 번역 결과에 즉시 반영, 업무 표준화와 일관성을 높일 수 있게 했다.

 

글로벌 음성 번역 시장에서는 아마존, 마이크로소프트 등 해외 빅테크를 중심으로 유사 서비스 경쟁이 치열한 상황이다. 네이버는 음성 인식 AI와 번역 엔진을 독자 모델로 결합, 특히 한국어 및 일본어 시장에서는 사용성과 정확도 측면에서 강점을 보이고 있다. 미국 등에서는 아마존 트랜슬레이트와 구글 번역이 기업용 시장 공략을 강화하는데 비해, 네이버는 국내 업무·교육 환경 특화 기능을 차별화 포인트로 내세우고 있다.

 

음성·이미지 등 방대한 생산 데이터가 AI 번역 품질 개선의 핵심 변수로 떠오르며, 데이터 보호·저작권 이슈와의 조화도 과제로 지목된다. 파파고 플러스는 번역 데이터의 기업 내·외부 공유 범위를 세분화하는 등, 정보보호 정책 역시 강화한 것으로 알려졌다.

 

전문가들은 향후 실시간 음성 번역과 이미지 번역 융합이 제품화될 경우, 비즈니스와 교육 현장에서 언어장벽이 사실상 사라질 가능성에 주목하고 있다. 산업계는 이번 기술이 실제 시장에 안착할 수 있을지 주시하고 있다.

강예은 기자
share-band
밴드
URL복사
#네이버#파파고#음성번역