“AI 복제 목소리 상업화”…일레븐랩스, K콘텐츠 노린다
인공지능 오디오 전문기업 일레븐랩스가 한국 유명인의 목소리를 AI로 복제해 상업용 콘텐츠와 광고에 활용하는 사업을 추진한다. 글로벌에서 검증된 텍스트 음성 변환 기술을 바탕으로 한국어와 각 지역 사투리까지 품질을 끌어올리며, K콘텐츠 더빙과 고객 상담 시장을 겨냥한 본격적인 현지화 전략에 속도를 내는 모습이다. 업계에서는 AI 음성 기술이 콘텐츠 제작 구조와 광고 산업 전반의 패러다임을 바꾸는 분기점이 될 수 있다는 전망도 내놓고 있다.
마티 스타니셰프스키 일레븐랩스 공동 창업자 겸 최고경영자는 서울 강남에서 열린 기자간담회에서 한국 유명인의 목소리를 활용한 AI 음성 상품 출시 가능성을 공개적으로 언급했다. 그는 K드라마와 케이팝에는 세계적으로 경쟁력 있는 목소리가 많다고 강조하며, 한국 유명인과의 협업 가능성이 열려 있고 이미 일부 인사들과 초기 대화를 진행 중이라고 설명했다. 한국 시장을 독립적인 수요처가 아니라 글로벌 팬덤과 연결된 K콘텐츠 허브로 바라보는 전략이 드러나는 대목이다.

일레븐랩스는 이달 초 유명인의 AI 복제 목소리를 상업적으로 판매하는 아이코닉 보이스 서비스를 선보였다. 토머스 에디슨, 앨런 튜링, 리처드 파인만과 같은 과학자부터 배우 마이클 케인, 야구 선수 베이브 루스까지 28명 목소리를 합법적으로 활용할 수 있도록 구성했다. 일부는 이미 사망한 인물이어서 생전 인터뷰와 연설, 라디오 녹음 등 과거 오디오 기록을 정제해 학습 데이터로 활용했고, 이를 통해 자연스러운 고품질 합성 음성을 만들어냈다. 이 플랫폼은 특정 목소리에 대한 권리를 보유한 개인이나 유족, 기업과 콘텐츠 제작자·플랫폼을 라이선스 계약으로 연결하는 구조를 취하며, 단순 기술 제공을 넘어 음성 권리 거래 시장을 조성하는 데 초점을 맞추고 있다.
마이클 케인은 아이코닉 보이스에 대해 목소리를 대체하는 기술이 아니라 증폭하는 도구로 평가했다. 자신의 목소리가 AI를 통해 새로운 세대의 스토리텔러에게 전달되고, 다른 창작자들이 이야기를 들려줄 수 있도록 돕는 역할을 할 수 있다는 점에서 긍정적인 메시지를 보냈다. 일레븐랩스는 이러한 유명인의 공개 발언을 전면에 내세워, AI 음성 합성이 창작 생태계의 파트너라는 이미지를 강화하려는 전략으로 보인다.
기술적 관점에서 일레븐랩스는 대규모 딥러닝 기반의 텍스트 음성 변환 모델을 고도화하며 품질 경쟁을 이어가고 있다. 2023년 초 공개한 TTS 도구로 사실적인 음성 복제를 구현해 글로벌 주목을 받았고, 현재 월간 이용자 수는 5천만 명 이상으로 추산된다. 스타니셰프스키 CEO에 따르면 글로벌 마켓플레이스 기준 등록된 음성은 1만개를 넘어섰고, 음성 제공자에게 돌아간 수익은 약 1천1백만 달러에 이른다. 이는 단일 기술 플랫폼이 음성 재능 공급자와 수요자를 직접 연결하는 시장을 형성하고 있음을 보여주는 지표다.
한국 시장을 향한 일레븐랩스의 전략은 크게 두 축으로 나뉜다. 하나는 아이코닉 보이스를 통한 유명인 음성 상품화이고, 다른 하나는 한국어 및 사투리 모델의 정교화다. 회사 측은 이미 마켓플레이스에 400개 이상의 한국어 음성이 등록돼 있으며, 지역별 사투리와 말투, 화자의 나이, 성별, 스타일을 다양하게 제공하고 있다고 밝혔다. 다음 달 공개 예정인 새 모델에서는 한국어 발음과 억양, 문맥 이해 능력이 대폭 향상될 것이라고 예고했다. 지역별 억양 차이를 세밀하게 반영하는 한편, 문맥에 따라 감정과 말투를 달리하는 고성능 합성 모델을 지향하는 것으로 풀이된다.
특히 일레븐랩스는 한국을 아시아 음성 AI 허브로 키우겠다는 목표를 제시했다. 내년 상반기 중 한국 지사 사무실을 열고 전담팀을 확충해 K콘텐츠 더빙, 게임 및 애니메이션 음성 제작, 콜센터 자동응답, 금융·통신 고객 상담, 각종 음성 기반 서비스까지 파트너십을 넓히겠다는 계획이다. 한국에서 확보한 기술과 데이터, 레퍼런스를 기반으로 일본과 동남아 등 인접 시장으로 확장하는 교두보 역할도 고려하는 것으로 보인다.
AI 복제 음성의 상업 이용이 빠르게 확대되는 가운데, 딥페이크·사기 전화·저작권 침해 등 부작용 우려도 커지고 있다. 일레븐랩스는 동의, 통제, 보상을 축으로 하는 내부 프레임워크를 구축해 윤리적 리스크를 선제적으로 관리하겠다고 강조했다. 홍상원 한국지사장은 동의는 음성 제공자 신원과 권리 보유를 확인하는 철저한 검증 단계이고, 통제는 누구의 목소리가 어디서 어떻게 쓰이는지 완전한 추적과 차단이 가능한 시스템을 의미하며, 보상은 음성 사용량과 계약 조건에 기반한 공정한 수익 분배 구조라고 설명했다.
스타니셰프스키 CEO는 AI 음성 악용이 앞으로 큰 사회적 이슈가 될 것이라고 경고하면서, 생성 단계부터 배포 이후까지 전 주기에 걸친 방지 기술을 개발 중이라고 밝혔다. 콘텐츠 출처 추적 기술로 합성 음성 여부를 표시하고, 사기 탐지와 실시간 차단 시스템으로 금융·통신 영역에서 발생할 수 있는 피해를 줄이겠다는 구상이다. 더불어 생성 전 단계에서 위험도가 높은 사용 패턴을 인지해 사전에 플래그를 걸고, 필요할 경우 자동 차단하는 다층 구조를 구축하고 있다고 덧붙였다.
일레븐랩스는 자사 모델뿐 아니라 외부 오픈소스와 상용 합성 음성까지 탐지할 수 있는 전용 탐지 모델도 병행 개발하고 있다. 각국 보안 기관과 민간 기업과의 협력을 통해, 다수의 음성 합성 기술이 뒤섞인 환경에서도 위변조 음성을 식별할 수 있는 공통 인프라를 마련하려는 시도다. 글로벌 차원에서 AI 음성 탐지가 표준 보안 기능으로 자리 잡을 수 있다는 관측도 제기된다.
시장 측면에서는 한국 유명인의 아이코닉 보이스 참여 여부가 일레븐랩스의 현지 사업 속도에 직접적인 영향을 줄 전망이다. 한류 스타의 목소리가 합법적으로 라이선스된 AI 음성으로 전 세계 팬들에게 제공될 경우, 드라마와 영화 더빙, 팬 경험 콘텐츠, 게임 캐릭터 보이스 등 다양한 수익 모델이 동시에 열린다. 반대로 초상권과 퍼블리시티권 해석, 사후 인물의 목소리 활용에 대한 국내 법제 정비가 늦어질 경우, 상용화 속도에 제동이 걸릴 가능성도 있다.
전문가들은 AI 합성 음성이 미디어와 광고 산업의 효율성을 높이면서도, 사회적 신뢰를 훼손하지 않는 제도 설계가 핵심 변수라고 지적한다. 한국에서 추진 중인 AI 윤리 가이드라인과 데이터 규제 개편, 전기통신금융사기 방지 대책 등과 AI 음성 기술의 접점을 어떻게 정교하게 조율하느냐에 따라, 산업 성장 속도와 방향이 갈릴 수 있다는 분석이다.
스타니셰프스키 CEO는 한국 기업들과 함께 한국어 모델의 발음과 억양, 맥락 이해 능력을 개선하는 작업에 상당한 시간을 투입해 왔다며, 서비스별 특성을 반영한 맞춤형 모델 고도화를 이어가겠다고 밝혔다. 산업계는 일레븐랩스의 기술과 비즈니스 모델이 국내 규제와 시장 환경에 맞게 안착할 수 있을지를 예의주시하고 있다. 기술과 윤리, 산업과 제도의 균형이 글로벌 음성 AI 경쟁에서 새로운 성장 조건이 되고 있다는 평가가 나온다.
