“AI 뉴스데이터 학습료 연 877억”…저작권 기준 논의 분수령
생성형 인공지능이 뉴스 등 저작물을 대규모로 학습하는 시대, AI 기업이 언론사에 지급해야 할 저작권 보상 체계의 근거가 처음으로 국내에서 제시됐다. AI 기술의 발전이 언론 콘텐츠 생태계에 미치는 영향은 물론, 뉴스데이터의 경제적 가치와 공정이용 논쟁까지 기술·산업·법제 모두에서 분기점으로 떠올랐다. 업계와 학계는 이번 연구에서 제안된 구체적 산정 방식을 ‘AI 데이터 공정 이용’ 경쟁의 기준점이 될 가능성이 높다고 본다.
AI 학습용 뉴스 데이터의 저작권료 규모 산정은 22일 서울 국회의원회관에서 열린 ‘AI기업과 미디어 창작자의 상생 발전 방안’ 세미나에서 공식 발표됐다. 변상규 호서대 교수는 생성형 AI 기업이 지상파3사 뉴스데이터를 활용할 때, 연간 약 877억6000만원가량의 대가를 지불해야 한다고 추산했다. 해당 수치는 수익접근법(뉴스데이터의 AI 서비스 내 매출 기여도)과 비용접근법(전체 뉴스 제작비 대비 AI가 분담해야 할 비율)을 바탕으로 산정했다. AI 이용자 대상 조사를 토대로 월 기준 뉴스데이터 학습의 가치를 기존 분석보다 높게 제시한 점이 이번 연구의 특징이다.

뉴스데이터는 LLM(대규모 언어모델) AI 학습의 기초가 되는 고품질 텍스트로 꼽힌다. 변상규 교수는 “생성형 AI의 핵심 경쟁력은 학습데이터의 품질이며, 뉴스콘텐츠는 정확성과 최신성이 결합된 최적의 데이터”라고 강조했다. 수익접근법에 따르면 이용자는 뉴스데이터에 기반한 언어능력·최신성 향상에 월 2만원에 가까운 가치를 매겨, 이를 국내 약 100만 이용 단위로 환산하면 연간 713억~1112억원에 달한다는 설명이다. 2024년 지상파3사의 전체 뉴스 제작비(4283억원) 중 AI가 차지하는 데이터 분담률을 20.5%로 평가한 것도 현실적 분배 구조를 반영했다.
특히 이번 분석은 TDM(텍스트 데이터 마이닝) 면책 입법 논의가 가열되는 현실에서 ‘공정이용’과 저작권자 정당한 이익 보호 기능의 균형점을 고민하게 만들었다. 최승재 세종대 교수는 “AI 산업의 지속가능성과 창작자 생태계의 경쟁력을 위해, 상업적 AI 데이터 활용에는 합리적 보상이 필수”라며, 성급한 면책법 제정은 오히려 시장과 창작 모두를 위협할 수 있다고 지적했다. 변 교수 또한 “객관적 가치 평가와 합리적 분배 기준이 확립돼야 한다”고 강조했다.
국내외에서는 저작권 행사와 AI 산업 활성화의 균형 이슈가 본격 부상 중이다. 미국, 유럽 등 선진국은 데이터 면책의 폭과 저작권자와 AI 기업 간 협상력을 둘러싼 법적 규정 논의가 활발하다. 국내 역시 현행 저작권법 내 공정이용 조항 해석, 면책 입법의 한계, 데이터 주권 및 기술 종속 리스크 등이 복합적으로 쟁점화되고 있다.
토론에 나선 전문가들은 저작물 공급의 유인책, 데이터 품질·환경의 유지, AI 산업과 콘텐츠 생태계의 상생 원칙을 나란히 지적했다. 김태경 변호사는 “무분별한 데이터 개방이 곧 기술 식민지화로 이어질 수 있다”며, “공정이용 판례 축적과 신중한 법제 해석이 필요하다”고 조언했다.
산업계는 이번 저작물 가치 산정 결과와 법적 논의의 실제 상용화 효과에 주목하고 있다. 기술, 법제, 산업 간 균형 잡힌 기준 확립이 AI 시대 플랫폼·콘텐츠 산업의 향방을 결정지을 수 있다는 전망이 나온다.
