“클라우드 이중화 없었다”…국가전산망 화재에 재난복구 시스템 부실 논란
3년 전 카카오 데이터센터 화재 후, 정부가 "실시간 백업으로 3시간 내 복구"를 장담했던 공공 IT 자원의 재해복구 시스템이 실제 사고에서는 나흘이 지나도 작동하지 않고 있다. 민간에 강력한 재난복구 시스템 도입을 요구했던 정부가 정작 국가정보자원관리원(국정자원) 데이터센터에서 터진 화재 사고에서는 이중화·DR(재해복구) 체계의 부실을 고스란히 드러냈다는 분석이다. IT·바이오 업계는 이번 사고를 2022년 판교 카카오 먹통 사태와 유사한 구조적 결함이 반복된 사례로 보고, 공공 IT 인프라의 신뢰성에 경각심을 표하고 있다.
지난 26일 국정자원 대전센터 배터리실에서 발생한 화재로, 정부 전산 시스템 647개 중 대다수가 멈췄고, 국민 일상과 직결된 정부24, 국민신문고, 마이데이터 등 핵심 공공서비스까지 이용이 불가능해졌다. 정부는 화재 피해가 없는 551개 서비스를 우선 복구하겠다고 밝혔으나, 사고 나흘째에도 3분의 2 이상의 시스템이 ‘먹통’ 상태다.

문제는 화재·폭발에 취약한 데이터센터 내 배터리실 안전설계와 데이터 실시간 백업, 이중화 체계 미비 등 3년 전 카카오 사고 당시 드러난 약점이 여전히 개선되지 않았다는 점이다. 이번 사고도 리튬이온 배터리와 서버의 분리작업 과정에서 화재가 촉발됐으며, 배터리 실 특성상 빠른 진화가 어렵다는 점까지 판교사고와 유사하다. 국정자원은 카카오 사태 이후 예산을 확보, 단계적 배터리 분리 작업을 진행 중이었지만 사고를 막지 못했다.
특히 정부는 과거 “공공 IT 재난복구 시스템은 민간보다 더 안전하다”며 복구 시간을 3시간 이내로 못박아왔으나, 실상은 클라우드 이중화 미비 등으로 신속 복구가 사실상 불가능했다. 국정자원센터는 서버 DR(물리적 장비 이중화)만 갖췄고, 클라우드 DR 기반의 서비스 이중화는 구축하지 않아 물리적 화재와 동시에 전체 시스템이 중단됐다. G-클라우드존 등 국가 데이터 인프라의 핵심인 센터조차, 정부가 민간 기업에 강조한 DR 기준을 충족하지 못했던 셈이다.
이중화 체계의 취약성은 복구 지연의 핵심 원인으로 지목된다. 클라우드 DR 체계가 도입된 민간의 경우, 물리적 서버 손상 시에도 다른 데이터센터로 서비스를 전환할 수 있어 다운타임 최소화가 가능하다. 하지만 국정자원은 사고 시 대용량 스토리지 및 백업만으로 재난복구를 시도하고 있어, 당초 정부가 제시했던 복구 시간 준수는 애초에 현실적이지 않았던 것으로 드러났다.
카카오 사태 이후 정부는 통신재난관리계획 의무화, 부가통신사 보호 대책 강화 등 민간에 사실상 과도한 DR투자와 이중구축을 요구해왔다. 반면 정부와 공공기관 IT시스템에는 동일한 수준의 기준을 바로 적용하지 않았고, 예산과 부처 간 이해관계에 가로막혀 방치돼 왔다는 점에서 형평성 논란이 확산되고 있다. 실제로 넷플릭스, 삼성헬스 등 안전과 직접적 연관성이 낮은 사업자도 정부 방침에 따라 DR관리 의무 대상에 포함된 것으로 나타났다.
전문가들은 “카카오 사태가 데이터센터 단일화의 한계를 드러냈다면, 국정자원 사고는 공공 부문도 동일한 위험에 취약하다는 것을 보여줬다”고 평가한다. 염흥열 순천향대 명예교수는 “정부 역시 클라우드 이중화의 필요성을 인식해왔으며, 추진 중 사고가 난 점은 아쉽지만 방향성 자체는 맞다”며 “이번 사태를 계기로 공공 IT 인프라의 DR체계 고도화와 신속 복구 프로세스 마련이 시급하다”고 했다.
IT업계는 공공서비스 회복과 재난 컨트롤타워 체계 재정비에 촉각을 곤두세우고 있다. 결국 기술의 속도뿐 아니라, 실제 시스템 운영과 투자, 관리의 균형이 신뢰 구축의 핵심이라는 지적이 힘을 얻고 있다.