“AI, 30개 언어 목소리 구현”…투플랫폼, 감성 음성합성 출시로 시장 판도 바꾼다
인공지능(AI) 기반 초저지연 다국어 음성 합성 기술이 급부상하며, 글로벌 비즈니스 현장에서의 언어 장벽 해소와 실시간 자동화가 동시다발적으로 진행되고 있다. 투플랫폼이 새롭게 선보인 ‘수트라 하이파이’는 30여개 언어를 지원하는 실시간 음성 합성 모델로, 한국어를 비롯한 영어, 힌디어, 베트남어, 아랍어 등 다양한 언어에서 사람처럼 자연스러운 대화와 감정을 구현해 산업 현장에 파장을 일으키고 있다. 업계는 이번 기술 출시를 다국어 AI 상담 경쟁의 전환점으로 평가하고 있다.
투플랫폼은 29일, 자사 독자 AI 모델 ‘수트라(SUTRA)’의 언어 처리 엔진을 바탕으로 30개 이상 언어에 감정 표현, 억양, 발화 리듬까지 실제 사람 수준으로 구현한 ‘수트라 하이파이’의 상용화를 공식 발표했다. 기존 텍스트 음성 변환(TTS)이 기계적이고 불연속적인 톤에 머물렀던 데 반해, 이번 모델은 실시간 반응성(초저지연)과 감성적 뉘앙스 재현에서 차별성을 확보했다. 텍스트 요약 및 질의응답, 번역 등 기존 ‘수트라’의 언어 AI 역량이 음성 영역으로 확장된 것이다.

‘수트라 하이파이’ 기반 AI 고객 상담 솔루션은 AI가 고객의 단순 문의를 자동 처리하고, 복잡하거나 민감한 사항에는 즉시 전문 상담사가 개입하도록 설계됐다. 산업별 전문 용어와 다양한 고객 응대 시나리오를 자체 학습해 상황별 맞춤형 답변이 가능하다는 점에서 기존 상담봇과 비교 우위를 보인다. 특히, 해외 콜센터 운영 기업에서는 외국인 상담사가 실시간 번역 및 자연스러운 톤으로 응답 메시지를 자동 작성할 수 있어 내부 효율성 개선 효과가 기대된다.
투플랫폼은 4월부터 KS한국고용정보 등 국내외 기관·기업과 협력해 해당 솔루션의 필드 테스트를 진행 중이다. KS한국고용정보에서는 해외 콜센터 현장에 AI 고객 상담과 AI 채팅 기능을 적용, 외국인 실무자가 한국어 메시지를 실시간 이해·응답하도록 하고 있다. 향후 2~3개월 내 24시간 대응이 가능한 다국어 콜봇 서비스도 도입될 예정이다.
글로벌 시장에서는 이미 구글, 마이크로소프트 등 주요 IT 기업들이 다국어 AI 음성 모델 경쟁에 뛰어든 가운데, 국내 기술로 상용화 범위를 확장했다는 점이 주목받는다. 해외 사례와 비교할 때, 투플랫폼의 모델은 감정 표현과 자연스러움, 실시간성 측면에서 글로벌 경쟁 제품과 비견할 만하다는 평가다.
산업 현장에서 AI 음성 생성의 활용이 빠르게 늘어나자, 정보보호 및 퍼스널 데이터 규제, 사람과 AI 간 경계에 대한 사회적 논의도 활발해지는 모습이다. 특히 상담 및 고객 응대 과정에서의 윤리성·투명성 확보와, 언어 데이터의 안전한 처리 등이 제도화 과제로 지적된다.
프라나브 미스트리 투플랫폼 대표는 “AI 음성 기술이 단순 낭독을 넘어 감정, 뉘앙스까지 전달하며 기업의 글로벌 고객 확보에 실질적인 변화를 준다”며 “수트라 하이파이를 통해 산업 전반의 해외 비즈니스 환경 개선에 나설 것”이라고 밝혔다. 업계는 이번 기술이 실제 글로벌 현장에 뿌리내릴 수 있을지 예의주시하고 있다.