IT/바이오

“AWS 장애, 국내 서비스 멈췄다”…클라우드 의존 리스크 재조명

김서준 기자
입력

글로벌 클라우드 산업의 중심축인 아마존웹서비스(AWS) 주요 리전에서 대규모 장애가 발생하면서, 생성형 AI 검색엔진 퍼플렉시티와 삼성월렛, 크래프톤의 배틀그라운드 등 국내외 주요 IT·플랫폼 서비스가 일제히 접속 장애를 겪었다. AWS 클라우드를 활용하는 기업이 전 세계적으로 급증한 상황에서, 단일 인프라 구조의 리스크가 산업 전체에 즉각적 영향을 미친 사례라는 점에서 업계 시선이 집중된다. 전문가들은 “이번 사태가 클라우드 중심 디지털 경제의 복원력 경쟁을 가속화할 분기점”이라고 평가하고 있다.

 

20일 IT업계에 따르면 현지시각 20일 오전 12시경 AWS가 운영하는 ‘US-EAST-1’(미국 동부 1) 리전 내에서 대규모 서비스 장애가 발생했다. AWS는 해당 리전에서 일부 인스턴스의 장애를 공식적으로 확인했으며, 오전 2시 27분경 복구가 상당 부분 완료됐다고 밝혔다. 하지만 문제는 AWS의 핵심 인프라가 62개 자체 서비스에 영향을 미치면서, 이 리전을 기반으로 한 글로벌 플랫폼 서비스가 실시간으로 멈췄다는 점이다.

퍼플렉시티처럼 생성형 AI 엔진부터 삼성월렛, 온라인 게임 배틀그라운드까지 국내외 서비스 다수가 단기간에 중단되거나 성능 저하를 겪었다. 사용자들은 장애 모니터링 사이트 ‘다운디텍터’ 등에 수천 건의 접속 및 오류 신고를 올렸고, 퍼플렉시티 CEO 역시 “AWS 장애가 근본 원인”임을 공식 확인했다. 특히 AI, 핀테크, 게임 등 신기술 활용도가 높은 산업일수록 클라우드 대형 사업자에 대한 의존도가 절대적이라는 구조적 현실이 다시 드러난 셈이다.

 

기술적으로 클라우드 리전(region)은 분산된 데이터센터를 통해 고가용성과 장애 대응 능력을 강화하는 것이 원칙이지만, 미동부 1번 리전처럼 고객·트래픽이 집중된 ‘슈퍼 허브’ 단일 장애 발생 시 복수 서비스 연쇄 마비가 불가피하다는 점이 재부각됐다. 특히 각국 주요 기업이 ‘시장 점유율-효율성-단가’ 논리로 AWS 등 소수 글로벌 클라우드에 시스템을 통합하는 경향이 심화되는 만큼, 앞으로 서비스 연속성 확보 및 다중화 전략이 중요한 화두로 떠오를 것으로 보인다.

 

글로벌 시장에서도 클라우드 신뢰성과 리전 다중화, 자국 내 데이터센터 구축 경쟁이 확산되고 있다. 미국은 민간·공공 부문에서 별도 DR(재해복구) 백업 정책을 앞세우고 있고, 유럽 역시 ‘GAIA-X’ 등 역내 데이터주권 프로젝트를 본격화하고 있다. 국내에서도 지난해부터 금융·공공 클라우드 2중화 위험관리 지침이 적용됐다. 하지만 이번 장애처럼 단일 사업자에 대한 산업 차원의 의존도가 여전히 높다는 비판도 나온다.

 

산업계 한 관계자는 “클라우드가 제공하는 효율성과 혁신에도 불구하고, 단일화된 인프라 구조의 리스크가 이제 실시간 시장 리스크로 전이된 상황”이라며 “향후 멀티 클라우드, 하이브리드 전략 없는 기업은 예측 불가능한 장애에 무방비로 노출될 수 있다”고 말했다. 업계는 대형 클라우드 사업자의 안정화 조치와 별개로 기업·기관별 리스크 분산 전략 마련이 핵심 과제로 자리 잡을 수 있다고 진단하고 있다. 산업계는 이번 기술 장애가 실질적 서비스 복원력 강화로 이어질 수 있을지 주목하고 있다.

김서준 기자
share-band
밴드
URL복사
#aws#삼성월렛#퍼플렉시티