logo
“AI 대전환 맞춰 데이터 보호 강화”…통계청, 자동 비식별화 프로그램 도입
IT/바이오

“AI 대전환 맞춰 데이터 보호 강화”…통계청, 자동 비식별화 프로그램 도입

배진호 기자
입력

기계 학습 등 첨단 AI 시대에 개인정보 보호가 데이터 산업의 핵심 과제로 부상하는 가운데, 통계청이 자사 및 국가통계작성기관을 위한 자동 비식별화 프로그램 ‘KOSTAT-Did’를 개발·공개했다. 이 프로그램은 마이크로데이터를 외부에 제공할 때 개인정보 노출 위험을 자동으로 평가하고, 실질적으로 차단할 수 있는 기능을 갖춘 것이 특징이다. 통계청은 “AI 대전환 시대의 필수 인프라”라며, 데이터·AI 기반 경제로의 전환 국면에서 기술 도입이 미칠 파장에 주목하고 있다.

 

KOSTAT-Did는 통계자료(마이크로데이터)의 개인정보 노출 위험 평가와 함께, 특정 개인 및 법인·사업체 식별 위험을 자동으로 처리한다. 기존에는 담당자들이 엑셀 등으로 수작업 처리하던 비식별화 업무가 프로그램화되면서 정확도와 효율성이 대폭 향상될 전망이다. 마스킹, 범주화, 통계적 노이즈(잡음) 첨가, 자료 교환(스와핑) 등 15종의 비식별화 기법이 내장됐으며, 처리 결과에 대한 표준화된 평가보고서가 자동 생성되는 것도 주목할 만하다. 이 보고서는 정보손실과 노출위험을 시각적으로 보여주고 수치화해, 정책결정자는 데이터 공개 범위와 안전성 수준을 근거로 신속하게 평가할 수 있다.

특히 이번 기술은 AI·데이터 학습 수요 증가에 따라 국가통계작성기관에 제공되는 상세 자료가 늘면서 불거진 개인정보 노출 리스크를 구조적으로 완화할 것으로 보인다. 통계청은 2023년 배포된 ‘통계작성 및 통계자료 제공 비식별화 가이드라인’의 실질적 구현 단계로 이번 프로그램을 개발했다. 2024년 10월부터는 전국 437개 국가통계기관 실무자를 대상으로 사용자 맞춤 교육도 추진한다.

 

해외 주요국들 역시 AI·빅데이터 활용 확산과 맞물려 데이터 보호 규제와 인프라 자동화에 나선 상황이다. 미국과 유럽은 통계청 등 공공기관 차원에서 수치데이터 비식별화 자동화 시스템을 속속 도입 중이며, EU는 지침 수립과 기술 확장에 속도를 내고 있다. 국내에서는 통계청이 이번에 처음으로 실무적용 가능한 자동화 솔루션을 통합 제공하며 글로벌 트렌드를 반영했다.

 

데이터 비식별화는 개인정보 보호법·데이터3법 등 국내 법규의 핵심 요구사항 중 하나다. 그간 대부분 수작업에 의존하던 통계자료 비식별화가 자동화될 경우, 신속하고 안정적인 데이터 개방·유통, 정보보호 수준 향상, 정책 신뢰성 제고 등 다층적 효과가 기대된다. 전문가들은 “AI·데이터 산업의 공공 신뢰와 경쟁력을 좌우할 핵심 인프라”라고 평가하면서도, 기술·윤리·법제도 간의 균형 발전이 필수적이라는 시각을 보인다.

 

산업계는 이번 기술이 실제 통계 데이터 개방과 AI 학습 데이터 제공 실무에서 안전장치로 안착할 수 있을지 주시하고 있다. 데이터 보호와 활용의 균형, 자동화와 투명성 확보가 앞으로 디지털 경제 성장의 토대가 될 것으로 보인다.

배진호 기자
share-band
밴드
URL복사
#통계청#kostat-did#비식별화