“스트리머 대신 방송하는 AI”…SOOP, 쌀사 2.0으로 생방송 혁신 노린다
생성형 인공지능과 실시간 방송 플랫폼의 결합이 인터넷 방송 패러다임을 빠르게 바꾸고 있다. SOOP이 공개한 인공지능 매니저 쌀사 2.0은 스트리머의 얼굴, 목소리, 과거 방송 데이터를 조합해 실제 진행자를 대신해 방송을 이어가는 역할을 맡는다. 시청자와의 대화, 광고 노출, 콘텐츠 기획까지 AI가 관여하는 구조가 가시화되면서 라이브 스트리밍 산업 내 인력 구조와 수익 모델 변화에도 관심이 쏠린다. 업계에서는 이번 발표를 AI 기반 실시간 방송 경쟁의 분기점으로 보는 분위기다.
SOOP은 서울 상암 SOOP 콜로세움에서 열린 2025 스트리머 대상 행사에서 쌀사 2.0 구상을 공개했다. 그동안 공개돼 온 쌀사, 수피, 싸빅은 1.0 수준의 초기 버전으로, 채팅 보조나 간단한 영상 생성 등 제한적인 기능에 초점이 맞춰져 있었다. 서수길 대표는 2026년을 기점으로 세 AI를 모두 2.0 단계로 끌어올려, 스트리머와 이용자가 실제 체감할 수 있는 수준의 실시간 지원과 자동화를 구현하겠다고 밝혔다.

쌀사 2.0의 핵심은 스트리머 부재 시에도 방송이 끊기지 않도록 하는 대리 진행 기능이다. 스트리머가 잠시 자리를 비우거나 장시간 잠방을 진행할 때, 쌀사는 스트리머의 목소리 특성과 표정, 말투, 이전 방송에서의 상호작용 데이터를 학습한 가상 진행자로 전환된다. 시청자 채팅을 읽고 답변하며, 기존 방송에서 자주 쓰이던 리액션과 농담 패턴을 재현해 실제 진행자와 유사한 몰입감을 유지하는 구조다. 기존의 단순 자동 재생 영상이나 채팅봇과 달리, 방송 맥락을 파악해 상황에 맞는 응답과 연출을 제공하는 점이 차별 요소로 제시된다.
기술적으로는 실시간 음성 합성, 얼굴 표정 생성, 행동 제스처를 동시에 제어하는 멀티모달 생성형 AI가 핵심 축이 될 것으로 보인다. 스트리머의 음성 데이터와 영상 클립이 학습 데이터로 활용되고, 이전 방송에서의 채팅 기록과 반응 이력이 언어 모델의 프롬프트로 들어가 개별 채널에 최적화된 응답을 생성하는 구조다. 기존 TTS 기반 더빙이나 고정형 버추얼 유튜버와 비교하면, 쌀사는 상황별 대화 흐름과 감정 톤까지 실시간으로 조정하는 방향을 지향한다는 점에서 한 단계 높은 자동화 수준을 겨냥하고 있다.
SOOP은 쌀사의 활용 범위를 방송 대체 진행에만 두지 않고 커머스와 광고 영역으로 확장할 계획이다. 서 대표는 방송 화면에 노출된 상품이나 오브젝트를 쌀사가 인식해, 콘텐츠와 광고를 자연스럽게 연결하는 시스템 청사진을 제시했다. 예를 들어 스트리머 책상 위에 놓인 제품을 AI가 자동으로 감지해 상품 정보를 띄우고, 시청자의 질문에 쌀사가 답변하면서 구매 링크나 쿠폰을 안내하는 상호작용형 커머스가 가능해지는 구조다. 이는 단순한 배너 광고에서 벗어나, 방송 맥락에 맞는 대화형 광고를 구현해 전환율을 높이려는 시도로 해석된다.
쌀사와 함께 공개된 싸빅, 수피도 역할이 분화된다. 싸빅은 고품질 AI 영상 제작에 특화된 생성형 영상 엔진으로, 스트리머가 직접 촬영하기 어려운 배경이나 특수 효과, 3차원 캐릭터 연출 등을 자동 생성하는 기능을 강화한다. 수피는 이용자 맞춤 대화 비서로, 방송 추천, 채널 검색, 클립 정리, 채팅 요약 등 시청 경험 전반을 돕는 방향으로 품질 고도화를 추진한다. 세 시스템을 묶어보면 싸빅은 제작 도구, 쌀사는 방송 진행자, 수피는 시청자 어시스턴트로 역할이 구분되며, 결과적으로 플랫폼 내부에 AI 기반 통합 제작·운영 생태계를 구축하려는 전략으로 읽힌다.
글로벌 관점에서 보면, 라이브 플랫폼의 AI 도입 경쟁도 이미 본격화된 상태다. 북미와 일본 시장에서는 버추얼 스트리머와 AI 진행자가 늘고 있으며, 일부 플랫폼은 음성 합성과 채팅 봇을 결합한 가상 진행자를 시험 중이다. 다만 대부분은 정해진 스크립트에 의존하거나 특정 시간대에만 제한적으로 사용되는 단계에 머물러 있다. SOOP의 쌀사 2.0이 계획대로 구현될 경우, 실제 인기 스트리머의 개성 있는 말투와 리액션을 일정 수준 반영해 장시간 실시간 운영이 가능하다는 점에서 경쟁사 대비 차별성을 확보할 여지가 있다.
규제와 윤리 이슈도 향후 상용화 과정에서 핵심 변수가 될 전망이다. 스트리머의 음성·얼굴 데이터를 학습에 활용하기 위해서는 명시적 동의와 데이터 이용 범위 설정이 필요하며, AI가 생성한 방송 내용의 책임 소재 또한 쟁점으로 떠오를 수 있다. 스트리머 개인의 브랜드와 수익이 걸린 영역에서, AI가 실수하거나 부적절한 발언을 할 경우 책임 주체를 어떻게 규정할지에 대한 논의도 요구된다. 국내외 규제기관은 아직 실시간 방송용 생성형 AI에 특화된 가이드라인을 내놓지 않았지만, 저작권, 초상권, 개인정보 보호 규제와의 충돌 가능성도 상존하는 상황이다.
업계에서는 SOOP의 행보가 향후 라이브 방송 산업 전반의 자동화 수준을 가늠하는 시험대가 될 것으로 보고 있다. AI가 스트리머의 공백을 메우고, 영상 제작과 광고 연결까지 맡는 구조가 정착되면 1인 방송 운영 비용을 낮추고, 장시간 방송에 따른 피로도도 줄일 수 있다는 평가가 나온다. 동시에, 인기 스트리머 수요가 AI 대체로 일부 조정될 수 있고, 인간 진행자와 AI 진행자가 공존하는 새로운 시장 구도가 형성될 가능성도 거론된다. 산업계는 쌀사 2.0을 비롯한 SOOP의 AI 서비스가 실제 방송 현장에 얼마나 빠르게 안착할지, 그리고 기술과 제도의 조율이 어떤 방향으로 전개될지 예의주시하고 있다.
