“그래비톤5로 성능 25%↑”…AWS, 차세대 칩으로 클라우드 재편
ARM 기반 자체 설계 칩이 클라우드 데이터센터의 성능과 전력 효율을 동시에 끌어올리며 인프라 경쟁 구도를 바꾸고 있다. 아마존웹서비스가 5세대 일반용 프로세서 그래비톤5를 공개하며 범용 컴퓨팅 영역에서까지 자체 칩 비중을 확대하고 나섰다. 업계에서는 x86 중심이던 클라우드 서버 시장이 AI 전용 칩에 이어 범용 CPU까지 포함하는 종합 반도체 경쟁 구도로 재편되는 분기점으로 바라보고 있다.
아마존웹서비스는 현지시각 1일 미국 라스베이거스에서 열린 연례 행사 리인벤트에서 5세대 자체 설계 중앙처리장치 그래비톤5를 선보였다. 그래비톤 시리즈는 웹 서버, 데이터베이스, 컨테이너 등 일반적인 워크로드를 위한 범용 CPU 라인으로, 같은 날 공개된 AI 학습 특화 칩 트레이니움과 역할이 구분된다. 트레이니움이 대규모 인공지능 모델 학습에 특화된 가속기라면, 그래비톤은 AI를 포함한 대부분의 클라우드 서비스를 실제로 구동하는 기본 연산 엔진에 해당한다.

AWS에 따르면 그래비톤5는 이전 세대 대비 최대 25퍼센트 향상된 컴퓨팅 성능을 제공한다. 동시에 전력 대비 성능을 유지해 애플리케이션 처리 속도 개선과 비용 절감, 데이터센터 전력 사용 감소를 동시에 노린 설계라는 설명이다. 피터 드산티스 AWS 유틸리티 컴퓨팅 총괄 수석 부사장은 그래비톤5 기반 M9g 인스턴스가 직전 세대 M8g 대비 최대 25퍼센트 높은 성능을 제공하며, 현재 EC2에서 가장 우수한 가격 대비 성능을 제공하는 범용 인스턴스로 자리매김할 것이라고 강조했다.
그래비톤5의 핵심은 대규모 병렬 처리 능력과 메모리 접근 효율을 높이기 위한 코어 수, 캐시 구조 개선이다. 드산티스 부사장은 그래비톤5가 단일 패키지에 192개 코어를 탑재했고, L3 캐시 용량을 이전 세대의 5배 이상으로 늘렸다고 설명했다. 이로 인해 각 코어가 활용 가능한 L3 캐시 용량은 최대 2.6배 증가했다. L3 캐시는 CPU가 자주 접근하는 데이터를 미리 저장해 두는 고속 저장 공간으로, 데이터베이스 쿼리나 인메모리 애플리케이션처럼 메모리 접근이 빈번한 워크로드의 처리 속도와 응답 지연을 좌우하는 요소다. 코어 수와 L3 캐시가 동시에 늘어나면, 같은 물리 서버에서 더 많은 작업을 안정적으로 처리하면서도 성능 편차를 줄일 수 있다는 것이 AWS의 설명이다.
특히 이번 세대는 클라우드 네이티브 애플리케이션과 컨테이너 기반 마이크로서비스 환경을 겨냥해 멀티코어 확장성과 일관된 처리 성능을 강화한 것으로 해석된다. 코어당 캐시 비율을 높이면 갑작스러운 트래픽 증가 시에도 성능 저하 폭이 제한되고, 데이터가 CPU 외부 메모리로 이동하는 횟수를 줄여 지연 시간을 낮출 수 있다. 업계에서는 그래비톤5가 동일한 랙 공간과 전력 내에서 처리 가능한 작업량을 늘려, 데이터센터 단위의 총소유비용을 낮추는 방향으로 설계된 것으로 보고 있다.
AWS는 실제 고객 워크로드에서의 성능 데이터를 함께 공개하며 벤치마크 수치가 아닌 운영 환경 성능 향상이라는 점을 강조했다. 그래비톤5는 숙박 공유 플랫폼 에어비앤비 워크로드에서 최대 25퍼센트 성능 향상을, 협업 소프트웨어 기업 아틀라시안에서는 20퍼센트 지연 시간 감소를 보였다고 밝혔다. 인메모리 데이터베이스 SAP HANA의 온라인 트랜잭션 처리 쿼리 성능은 60퍼센트까지 개선된 것으로 나타났다. 웹 서비스, 협업 도구, 대규모 엔터프라이즈 데이터베이스 등 서로 다른 유형의 워크로드에서 모두 개선 효과가 확인됐다는 점은 범용 프로세서로서 그래비톤5의 적용 범위 확대를 의미한다.
그래비톤5 기반의 첫 인스턴스 제품군은 범용 워크로드용 M9g다. 현재 프리뷰 형태로 제공되며, 웹 애플리케이션 서버, 마이크로서비스, 중간 규모 데이터베이스, 캐시 서버 등 다양한 범위의 일반 워크로드 시험 적용이 가능하다. AWS는 컴퓨팅 집약적 워크로드를 위한 C9g 인스턴스와 메모리 집약적 워크로드를 겨냥한 R9g 인스턴스를 내년 중 선보일 계획이다. C9g는 영상 처리, 과학 연산, 고성능 컴퓨팅에, R9g는 인메모리 데이터베이스, 실시간 분석, 대규모 캐시 등 메모리 사용량이 많은 서비스에 투입될 것으로 예상된다.
시장 측면에서 그래비톤5 출시는 클라우드 인프라의 비용 구조와 벤더 종속성에도 영향을 줄 수 있는 포인트로 평가된다. 자체 설계 칩을 통해 서버 한 대당 처리량을 높이고 전력 사용량을 줄이면, 데이터센터 전체 운영 비용이 낮아져 장기적으로는 인스턴스 가격 구조와 할인 정책에도 변화를 줄 가능성이 있다. 고객 입장에서는 같은 예산으로 더 높은 성능을 확보하거나, 동일 성능을 더 낮은 비용으로 운영할 여지가 생긴다. 아울러 특정 외부 CPU 제조사 의존도를 낮출 수 있어, 반도체 공급망 변동이나 가격 인상에 대한 리스크 관리 수단으로도 작용할 수 있다.
글로벌 차원에서는 ARM 아키텍처를 기반으로 한 클라우드용 서버 칩 경쟁이 한층 치열해지는 구도다. AWS의 그래비톤 시리즈를 비롯해 구글, 마이크로소프트도 각각 ARM 기반 자체 칩을 공개하며 데이터센터용 CPU 영역에서 인텔, AMD 중심 구조에 균열을 내고 있다. ARM 기반 칩은 와트당 성능이 높아 같은 작업을 더 적은 전력으로 처리할 수 있어, 대규모 데이터센터 운영 기업들이 전력 비용과 탄소 배출량을 낮추기 위한 해법으로 주목받고 있다. 특히 AI 학습과 추론, 실시간 데이터 분석 수요가 급증하는 상황에서, 범용 CPU와 AI 가속기 조합 설계가 클라우드 성능 경쟁의 핵심 축으로 부상하는 흐름과 맞물린다.
정책과 규제 측면에서는 데이터센터 전력 소비와 탄소 중립 목표가 주요 변수로 떠오르고 있다. 유럽과 북미를 중심으로 데이터센터 신규 설립과 전력 사용에 대한 규제 검토가 진행 중인 가운데, 클라우드 사업자들은 더 높은 에너지 효율을 가진 자체 칩 개발을 통해 규제 대응력과 ESG 성과를 동시에 높이려는 전략을 구사하고 있다. 그래비톤5처럼 성능과 효율을 동시에 개선한 칩은 인프라 확장에 따른 환경 부담을 줄이려는 정책 기조와도 맞닿아 있다.
전문가들은 이번 발표가 단순한 칩 세대 교체를 넘어 클라우드 사업자들의 반도체 자립 전략 심화라는 흐름을 보여준다고 평가한다. 특정 CPU 공급사에 대한 의존을 줄이고, 서비스 특성에 맞는 맞춤형 칩을 병행 운용하는 구조가 확산될 수 있다는 관측이다. 업계에서는 그래비톤5 기반 인스턴스가 어느 수준까지 생태계와 개발자 지원을 확보해 실제 워크로드 전환을 이끌어 낼지가 관전 포인트로 떠오르고 있다. 산업계는 이번 기술이 대규모 클라우드 인프라에 얼마나 빠르게 안착해 성능과 비용, 지속가능성 면에서 가시적인 성과를 낼 수 있을지 주시하고 있다.
