“AI가 내 목소리로 통역한다”…구글, 실시간 음성 번역 업그레이드로 업계 지각변동
인공지능(AI) 기반 음성 번역 기술이 글로벌 통신과 협업 방식의 패러다임을 다시 쓰고 있다. 구글이 선보인 최신 휴대폰 픽셀 10 시리즈는, 대화 상대의 목소리와 어조까지 반영한 실시간 통화 통역 기능을 탑재했다. 기존 기계음 번역을 넘어 화자의 자연스러운 음색을 유지해주는 것이 특징이다. 업계는 이번 기술 공개를 ‘글로벌 통화 플랫폼 혁신 경쟁’의 변곡점으로 바라보고 있다.
구글은 6월 20일 미국 뉴욕에서 열린 ‘메이드 바이 구글’ 행사에서 자체 설계한 칩셋 텐서 G5가 핵심이라고 강조했다. 텐서 G5는 TSMC의 3나노(nm) 제조 공정을 적용, 기존 대비 중앙처리장치(CPU) 성능이 34%, 텐서 처리장치(TPU)는 최대 60% 향상됐다. 이번 AI 통역 기능은 불과 몇 초의 입력 음성만으로 화자 목소리의 높낮이와 감정, 억양을 복제하는 원샷 음성 보존(one-shot voice preservation) 원리가 적용됐다. 이를 통해, 통역이 필요한 쌍방 간 통화에서도 실시간으로 각자의 언어로, 각자의 목소리를 듣는 듯한 경험을 제공한다.
기존 실시간 통역은 대체로 기계음이 출력되는 번역 방식에 머물러 있었다. 삼성전자, SK텔레콤, 구글 미트, 줌 등도 각각 서비스 내 통화·회의 번역 기능을 도입했으나, 사용자의 실제 음성 구현 수준에는 한계가 있었다. 구글의 새로운 AI 통역은 화자 음색과 감정까지 반영해 몰입형 대화가 가능하다는 점에서 차별성을 보인다.
이번 기술은 영어, 스페인어, 독일어, 일본어, 프랑스어, 힌디어 등 11개 언어 쌍에서 작동한다. 그러나 한국어는 지원 대상에서 제외됐다. 업계에서는 구글 픽셀 10 시리즈의 한국 출시가 이뤄지지 않는 점을 배경으로 본다. 실제 사용성 면에서는 글로벌 비즈니스, 해외 출장, 원격 회의 등 다양한 영역에서 활용도가 크게 확대될 전망이다. 다만 현장 반영 과정에서 언어·문화 특이성, 개인정보 보호, 데이터 보안 등은 지속된 고려 과제로 남아 있다.
미국·유럽·일본에서는 이미 빅테크 기업 중심으로 음성 통역 AI 기술 경쟁이 본격화된 상태다. 국내외에서도 삼성전자 ‘갤럭시 S24’, SK텔레콤 ‘에이닷’ 등 유사 기능이 잇따라 출시되며 시장의 관심을 끌고 있다. 한편, 현행 국내 규제에서는 통신 및 데이터 저장 시 개인정보처리방침·정보보호 기준을 엄격히 적용하게 돼 있다.
업계 전문가들은 “AI 기반 실시간 번역 기술은 국경을 넘어 협업 패러다임 자체를 바꾸는 계기가 될 것”이라고 내다보고 있다. “결국 기술의 혁신 속도뿐만 아니라, 시장과 제도의 변화가 함께 맞물려야 새로운 산업 생태계가 열릴 수 있다”는 지적도 나온다. 산업계는 이번 기능이 실사용 시장에 빠르게 안착할 수 있을지 예의주시하고 있다.