“레딧, AI 스타트업 무단 수집 제소”…퍼플렉시티 데이터 스크래핑 논란 확산
레딧이 퍼플렉시티 등 인공지능(AI) 스타트업을 상대로 대규모 데이터 무단 수집 문제를 공식 제기했다. 24일(현지시간) 파이낸셜타임스(FT), 로이터 등 외신에 따르면, 레딧은 퍼플렉시티가 자사 데이터를 불법적으로 수집해 AI 모델 훈련에 사용했다며 뉴욕 연방법원에 저작권 침해 소송을 냈다.
소장에 의하면 레딧은 퍼플렉시티 외에도 데이터 스크래핑 업체 3곳을 함께 고소했다. 이들 업체는 수십억 건의 검색 결과에서 레딧 데이터를 무단으로 수집한 것으로 지적됐다. 퍼플렉시티는 최소 한 곳의 고객으로 지목됐으며, 레딧은 퍼플렉시티가 AI ‘답변 엔진’ 작동을 위해 구글 검색 결과를 통해 레딧 자료를 집중적으로 긁어모았다고 강조했다.

퍼플렉시티 측은 “공공 정보에 대한 자유롭고 공정한 접근권을 위해 싸우고 있다”며 “정확한 AI와 사실 기반 답변을 중시하는 우리의 서비스는 원칙적이고 책임감 있다”고 맞섰다.
업계에서는 생성형 AI 경쟁이 치열해지는 가운데, 데이터 확보 과정의 저작권 분쟁이 심화될 조짐을 보이고 있다. 레딧은 구글, 오픈AI와는 유료 데이터 파트너십을 맺고 자사 콘텐츠의 AI 활용을 허용했으나, 퍼플렉시티에는 파트너십 제안을 했음에도 설립자 아라빈드 스리니바스가 관심을 보이지 않았던 것으로 알려졌다.
이번 사안은 지난 3월 상장한 레딧이 자사의 데이터 가치를 보호하는 동시에, 무단 활용에 대해 법적 대응 기조를 분명히 한 첫 사례라는 평가가 나온다. FT는 최근 AI 발전을 둘러싼 저작권 분쟁의 흐름이 앞으로 더욱 확산될 수 있다고 내다봤다.
전문가들은 “데이터 소유권과 AI 학습 활용의 경계가 명확하지 않은 만큼, 업계 전반의 룰 정립이 시급하다”며 “콘텐츠 공급자와 AI 기업 간의 갈등이 추가 소송으로 이어질 가능성도 열려 있다”고 진단했다.
향후 정책 및 업계 판례 변화에 따라, AI와 저작권 관련 분쟁은 새로운 국면을 맞게 될 전망이다.
