IT/바이오

“AWS 리전 장애에 AI까지 멈췄다”…퍼플렉시티 2시간 이상 ‘먹통’

배주영 기자
입력

클라우드 서비스 장애가 인공지능(AI) 산업의 신뢰성과 연속성에 중대한 파장을 일으키고 있다. 20일(한국 시간) 오후, AI 서비스 퍼플렉시티가 아마존웹서비스(AWS)의 미국-이스트-1 리전 오류로 2시간 이상 접속 불가 사태를 겪으며, 글로벌 IT기업의 ‘클라우드 의존성’ 리스크가 현장에 드러났다. 업계는 이번 장애를 ‘AI 인프라 신뢰’ 경쟁의 분기점으로 보고 주목하고 있다.

 

퍼플렉시티는 자사 홈페이지 및 브라우저형 AI 에이전트 ‘코멧’에서 20일 오후 4시부터 검색 등 핵심 명령에 대해 “문제가 발생했다”는 메시지를 응답 중이다. 아라빈드 스리니바스 최고경영자(CEO)는 엑스(X·전 트위터) 계정을 통해 “AWS 원인으로 접속 불가가 이어지고 있으며 복구 작업을 진행 중”이라고 밝혔다.  

AWS는 미국 현지 시간 20일 오전 1시 26분 미국-이스트-1 리전에서 대규모 오류가 시작됐다고 공식 안내했다. 리전(region)은 클라우드 서비스의 지리적 거점으로 다수 기업·서비스가 한꺼번에 영향을 받는다. AWS는 “이 기간 고객은 지원 사례 생성 및 업데이트가 원활치 않을 수 있다”고 밝혔다.

퍼플렉시티가 선택한 브라우저형 AI ‘코멧’ 역시 강점으로 내세운 실시간 웹서핑, 검색형 AI 에이전트 기능이 AWS 인프라 장애로 모두 멈춰섰다. 동일 인프라를 사용하는 아마존닷컴, 스냅챗, 듀오링고 등 주요 글로벌 서비스도 피해가 확산된 것으로 파악된다. 특히 이번 장애는 기존 백업체계나 이중화 운영만으로 핵심 AI 서비스 가용성을 담보하기 어렵다는 한계를 드러냈다.

 

현재 AI 서비스들은 방대한 데이터와 고성능 연산 자원을 빠르게 투입할 수 있는 클라우드 시스템 기반으로 제작되고 있다. 빠른 배포와 확장성에는 유리하지만, 특정 클라우드 리전에 결함이 일어날 경우 해당 지역 전체의 서비스가 일시에 중단될 수 있다. 글로벌 시장에서는 클라우드 사업자 간 백업체계 구축, 멀티·하이브리드 클라우드 도입이 거론되는 이유다.

 

AWS 등 주요 클라우드 기업은 최근 장애·사이버 위험 대책으로 리전 간 데이터 동기화, 대체 라우팅, 장애 대응 가이드 고도화를 발표했으나, 완전한 무중단 운영을 보장하는 수준에는 아직 도달하지 못했다. 미국 연방기관에서는 주요 공공 서비스의 리던던시 강화 기준을 신설하고 있다. 일각에서는 “클라우드 서비스 계약에서 서비스 중단 리스크와 배상 조건을 명확히 해야 한다”는 지적도 나온다.

 

전문가들은 “클라우드 인프라가 멈추면 AI 비즈니스 전체가 멈출 수 있다”며 “멀티 클라우드 전환 등 중복 인프라 구성이 산업계 필수 전략이 되고 있다”고 평가했다. 산업계는 이번 장애가 AI 기반 서비스 전반의 신뢰 체계 구축 문제를 재부각시키는 계기가 될지 눈여겨보고 있다.

배주영 기자
share-band
밴드
URL복사
#퍼플렉시티#aws#코멧