“공공저작물 1100만건, AI 학습 활용”…과기정통부, 규제샌드박스 특례 확대
공공저작물 1100만 건 이상이 인공지능(AI) 파운데이션 모델의 학습 데이터로 사용될 수 있는 길이 열렸다. 과학기술정보통신부는 11일 제42차 ICT 규제샌드박스 신기술·서비스 심의위원회를 개최하고, 공공저작물 학습용 데이터 구축 등 8건의 신기술 서비스에 대한 규제 특례를 승인했다. AI 생태계를 뒷받침할 대규모 데이터 활용이 공식적으로 허가되면서, 산업 경쟁력 확보의 분기점이 될 전망이다.
이번 특례는 공공누리(Open Government License) 등재 저작물의 AI 학습 활용에 필요한 실증 조건을 마련했다. 공공저작물 출처 표시 의무를 간소화하고, AI 학습을 위한 가공 행위도 허용했다. 다만 예기치 못한 저작권 침해를 막기 위해 사전 안내와 책임 보험 가입 등 방지책이 포함됐다.

한국지능정보화사회진흥원(NIA)이 중심이 돼 축적한 1180만 건의 저작물을 AI 파운데이션 모델 개발에 공급한다. 각종 텍스트·이미지 등 공공 데이터는 네이버클라우드, 업스테이지, SK텔레콤, NC AI, LG AI연구원 등 국내 대표 5개사에 제공돼, 토종 초거대 AI 모델 육성 프로젝트에서 활용된다. 전문가들은 “국산 AI 경쟁력의 핵심은 양질의 학습데이터 확보”라며, 이번 조치가 데이터 댐(Data Dam) 구축 이후 실제 산업 파급력을 강화할 단계로 평가했다.
아울러 SK브로드밴드의 AI 기반 숏폼 커머스 서비스, 국민은행·우리은행의 자체생산 전자문서 유통, LG유플러스의 실시간 보이스피싱 탐지 등도 특례 지정을 받았다. 홈쇼핑 상품을 AI로 압축 편집해 숏폼 영상으로 배포하는 등 디지털 서비스 혁신이 한층 빨라질 것으로 보인다. 전자문서를 직접 모바일로 발송하는 것은 국내 은행권 최초다. 동물의약품 유통·관리, 실시간 피싱탐지, 전자서명 등도 신규 규제특례 대상에 포함됐다.
이번 특례는 국내 규제 환경을 신기술 도입에 맞춰 재정비하는 정책 실험장이라는 평가다. 미국, 중국, 유럽 등 AI 선도국가들은 이미 공공데이터 개방-활용 정책을 강화하고 있다. 국내에서도 ICT 규제샌드박스 제도를 통해 신기술 상용화에 제도적 기반을 확보하며 글로벌 흐름에 대응 중이다.
배경훈 과기정통부 장관은 “AI 3대 강국 도약을 위해 규제 혁신은 필수”라며, “정부가 민간 혁신을 제도적으로 지원하는 원팀 전략을 계속 강화할 것”이라고 강조했다.
산업계는 대규모 공공 데이터 개방이 국내 AI 생태계 성장을 견인할지 주목하고 있다. AI 기술 도입과 제도 개혁의 균형, 데이터 저작권 보호 등 연착륙 방안 마련이 관건이 될 전망이다.