“AI가 목소리까지 만든다”…수퍼톤, 음성 기술로 창작 패러다임 전환
AI 음성 변환 기술이 엔터테인먼트 산업의 창작 방식을 근본적으로 바꾸고 있다. 국내 AI 스타트업 수퍼톤의 이교구 대표가 23일 싱가포르에서 열린 ‘브레인스톰 AI’ 행사에서 실시간 인간 목소리 변환 시연을 선보이며, 앞으로 누구나 손쉽게 독창적인 창작물을 제작할 수 있는 시대가 열릴 것이라는 전망을 내놨다. 업계는 이번 시연이 글로벌 창작 시장의 경쟁 구도를 흔들 ‘AI 기반 창작 도구 경쟁’의 분기점이 될 것으로 본다.
이번 행사는 미국 경제 전문지 포춘이 주최, 글로벌 기술리더가 집결해 AI 활용 방안과 산업 변화를 논의하는 자리였다. 이교구 대표는 ‘Voicing The Future’를 주제로 수퍼톤이 자체 개발한 파운데이션 모델과, 이를 활용한 실시간 AI 음성 변환 기술 ‘수퍼톤 시프트’의 데모를 진행했다. 그는 가상 그룹 ‘신디 에잇’의 노래를 현장 모더레이터의 음색으로 바꿔 재생함으로써, 4개 요소(음색, 발음, 음고, 강세)별 분리·가공이 가능한 최적화된 음성 생성 기술 구조를 제시했다.

수퍼톤의 AI 음성 기술은 창작자의 연출 목적에 맞춰 목소리를 자유롭게 바꿀 수 있다는 차별점이 뚜렷하다. 이를 통해 기존 음반 제작 및 아티스트 콘텐츠 프로듀싱에서 요구되던 음성 샘플 수집, 보정 작업의 한계를 극복한다. 실제 적용 시 아티스트가 의도한 음악적 아이덴티티 구현이 쉬워지고, 비전문가도 손쉽게 창작 활동에 참여할 수 있는 확장성이 주목된다.
현재 미국, 유럽 기반 빅테크 역시 AI 오디오 생성 모델에 집중 투자 중이지만, 수퍼톤은 한국 기업으로서 실시간 변환·적응형 목소리 생성 방식의 독자성을 내세운다. 미국 OpenAI, 유럽 Sonantic 등과의 시장 경쟁에서 분야별 고객 맞춤형 서비스와 실제 협업 사례가 산업 내 차별화 요인으로 평가받고 있다.
AI 기반 음성 기술이 확산되면서, 저작권·인격권 이슈와 함께 엔터테인먼트 산업 규제 환경에도 변화가 예상된다. AI로 생성된 인공 음성의 저작물 인정 범위, 데이터 보호 기준, 윤리적 사용 가이드라인 등이 국제적으로 논의되고 있으며, 한국 내에서는 과기부·문체부가 관련 제도 격차 해소 정책을 마련 중이다.
전문가들은 향후 AI 목소리 생성 기술이 실질적인 글로벌 음악·디지털 콘텐츠 제작 업계의 판도를 바꿀 잠재력이 크다고 평가한다. 국내외 창작 도구의 민주화가 이뤄질 경우, 다양한 목소리와 아이덴티티를 지닌 아티스트가 등장할 가능성도 있다. 이교구 대표 역시 “AI는 더 많은 창작자에게 새로운 기회를 열 것”이라고 밝혔다.
산업계는 AI 음성 기술이 실제 시장에서 창작 생태계의 변화를 이끌 수 있을지 주시하고 있다. 기술의 발전만큼 법·제도와 윤리, 그리고 창작자 보호의 균형이 새로운 성장의 조건으로 부상하고 있다.