“하이브리드 GPUaaS”…카카오엔터, AI 인프라 비용 딜레마 겨냥
인공지능 인프라의 비용 구조가 AI 산업 성장의 핵심 변수로 부상한 가운데, 카카오엔터프라이즈가 하이브리드 GPUaaS 모델을 새로운 대안으로 제시하며 시장 공략에 나섰다. AI 학습보다 추론 단계의 비용 비중이 커지는 흐름 속에서, GPU 자산을 어떻게 보유하고 어떤 방식으로 운영할지에 따라 서비스 기업의 수익성이 갈릴 수 있다는 분석이 뒤따른다. 업계에서는 이번 제안이 대규모 AI 인프라를 둘러싼 클라우드 활용 전략 경쟁의 분기점이 될 수 있다는 해석도 나온다.
카카오엔터프라이즈는 16일 서울 강남구 코엑스 그랜드볼룸에서 개막한 2025 AI를 위한 데이터&클라우드 진흥주간 행사에서 하이브리드 GPUaaS 구축 방안과 실제 적용 사례를 발표했다. 이 행사는 과학기술정보통신부가 주최하고 16일부터 19일까지 진행되며, 데이터와 클라우드 산업 관계자들이 최신 기술과 산업 동향, 향후 전략을 논의하는 장으로 마련됐다.

이재한 카카오엔터프라이즈 클라우드부문 사업본부장은 올해 하반기 출시한 엔터프라이즈 솔루션인 하이브리드 GPUaaS를 AI 인프라의 새로운 대안으로 소개했다. 그는 2026년에는 AI 추론에 드는 비용이 학습 비용을 넘어설 것으로 내다보며, 서비스 이용량이 늘수록 추론용 클라우드 비용이 기하급수적으로 커져 AI 서비스 기업과 기관의 적자폭을 확대할 수 있다는 구조적 위험을 짚었다.
현재 AI 인프라 시장에서는 두 가지 방식이 주로 활용된다. 하나는 퍼블릭 클라우드 사업자가 제공하는 GPUaaS를 온디맨드 형태로 임대하는 방식이고, 다른 하나는 기업이 직접 온프레미스 환경에서 GPU 서버를 구축해 운영하는 방식이다. 전자는 초기 투자 부담이 낮고 신속하게 확장할 수 있지만, 장기간 대규모로 사용할 경우 누적 비용 부담이 커진다. 후자는 일단 구축하면 단위 연산당 비용을 낮출 수 있으나, 상면 확보와 전력, 냉각, 운영 인력 등 초기·운영 부담이 상당하고 수요 예측 실패 시 자원이 유휴화될 수 있다.
이 본부장은 GPU가 대형 언어모델과 멀티모달 모델 등 최신 AI 개발의 필수 자원이지만, 기존 GPUaaS는 비용 측면에서, 온프레미스 방식은 인프라 구축과 운영 측면에서 각각 부담 요인이 크다고 지적했다. 이어 AI 서비스 기업과 기관이 비즈니스 성장 단계에 따라 빠르게 늘어나는 클라우드 비용 절감 방안을 찾는 동시에, GPU 자산 확보를 통해 수익성을 개선하는 전략을 병행해야 한다고 강조했다.
카카오엔터프라이즈가 제시한 해법은 고객이 GPU를 자산으로 소유하되, 카카오클라우드가 이 GPU를 기반으로 클러스터를 구성하고 클라우드 형태로 제공·운영하는 하이브리드 GPUaaS 모델이다. 초기 기술 검증과 서비스 기획 단계에서는 퍼블릭 클라우드 자원을 활용해 투자 리스크를 최소화하고, 본격적인 상용 서비스 단계에 진입하는 시점에 고객 자산으로 GPU를 확보해 장기 운영 비용을 낮추는 구조다.
이 모델에서 카카오클라우드는 GPU 클러스터 설계, 설치, 네트워크 구성, 스케줄링 소프트웨어, 모니터링, 장애 대응 등 전체 스택을 운영하며, 사용자는 기존 클라우드 서비스와 유사한 방식으로 AI 학습과 추론 워크로드를 실행한다. 개발 부서는 GPU가 실제로 어디에 물리적으로 위치해 있는지 신경 쓰지 않고, 사용량과 성능, 가용성을 API와 콘솔을 통해 관리할 수 있다. 즉, 자산은 고객이 소유하지만, 사용 경험과 운영 편의성은 클라우드형 서비스를 유지하는 구조다.
카카오엔터프라이즈는 이 방식이 AI 프로젝트의 불확실성이 큰 초기 단계에는 사용량 기반 과금 구조로 민첩성을 확보하고, 서비스 트래픽이 안정적으로 발생하는 시점부터는 자산화를 통해 비용 효율을 극대화하는 투 트랙 전략을 가능하게 한다고 설명했다. 특히 추론 단계에서 상시로 GPU 자원이 필요한 대규모 서비스 기업일수록, 장기적으로는 GPU 리스 또는 직접 구매를 통해 자산화하는 편이 총소유비용을 줄일 수 있다는 분석이다.
하이브리드 GPUaaS 모델은 글로벌 클라우드 시장에서도 관심이 커지고 있는 영역이다. 미국과 유럽에서는 초거대 AI 모델을 운영하는 기업을 중심으로 GPU를 직접 확보한 뒤 특정 클라우드 사업자의 코로케이션이나 매니지드 서비스를 통해 운영을 위탁하는 형태가 확산되는 추세로 알려져 있다. 반면 퍼블릭 클라우드에만 의존하는 경우, AI 붐에 따른 GPU 공급 부족과 가격 변동성, 특정 사업자 종속 문제에 취약할 수 있다는 지적이 따른다.
국내에서는 공공기관과 금융권을 중심으로 데이터 주권과 보안 요건을 충족하는 동시에, AI 인프라 확장성을 확보할 수 있는 방안에 대한 수요가 커지고 있다. 온프레미스 단독 구축은 내부 규제와 예산 구조의 제약으로 속도가 느리고, 전면적인 퍼블릭 클라우드 전환은 규제와 보안 우려가 상존하는 상황이다. 이 가운데 고객 소유 자산을 클라우드 형태로 관리하는 하이브리드 인프라 모델이 유력한 절충안으로 부상하는 모습이다.
규제 측면에서는 GPU 자산의 회계 처리, 공공부문 클라우드 도입 기준, 데이터 국외 이전 규제 등이 인프라 구조 설계에 영향을 줄 수 있다. 특히 공공과 금융 분야에서는 민감 데이터가 외부 클라우드로 이전되는지, GPU 클러스터가 어떤 네트워크 존에 위치하는지, 운영 주체와 책임 범위가 어떻게 나뉘는지 등이 주요 검토 요소가 된다. 카카오엔터프라이즈는 고객 자산과 클라우드 인프라를 결합하되, 각 산업별 규제 요건을 충족하는 아키텍처를 함께 설계하는 방향으로 하이브리드 GPUaaS를 확장하겠다는 구상이다.
이재한 본부장은 카카오클라우드의 하이브리드 GPUaaS가 클라우드의 유연성과 소유 기반의 경제성이라는 두 가지 가치를 동시에 확보할 수 있는 현실적인 해답이라고 평가했다. 또 AI 서비스 기업과 기관의 클라우드 전략 파트너로서, 불확실한 비즈니스 환경에서도 성장 단계에 맞춘 민첩성과 수익성을 함께 달성할 수 있도록 효율적이고 안정적인 인프라 전략을 제시하겠다고 밝혔다.
카카오엔터프라이즈는 17일 열리는 디지털서비스 서밋 2025 with PlugFest에도 참여해 클라우드 기술 진화와 미래 전략을 논의한다. 이 행사 좌담회에는 이승훈 카카오엔터프라이즈 PaaS개발실장이 패널로 나서 AI 혁신 인프라로서의 대한민국 클라우드의 미래를 주제로 의견을 나눈다. 한국지능정보원과 주요 국내 클라우드 기업들이 함께 AI 혁신 인프라로서의 클라우드 발전 방안, 첨단 클라우드 기술을 통한 신시장 대응 전략, 공공 부문의 민간 AI 클라우드 도입 촉진 방안 등을 논의할 예정이다.
한편 카카오엔터프라이즈는 16일과 17일 양일간 행사장 내 전시 부스를 운영하며 카카오클라우드 하이브리드 GPUaaS를 소개한다. 하이브리드 GPUaaS 도입에 관심 있는 기업과 기관을 대상으로 부스 방문 프로그램을 진행하면서, 실제 AI 서비스 환경에서의 활용 사례와 비용 구조, 단계별 도입 전략을 안내한다. 산업계는 하이브리드 GPUaaS가 AI 인프라 비용과 성능의 균형을 어떻게 재조정할지, 그리고 이 모델이 향후 국내 AI 클라우드 시장의 표준 중 하나로 자리 잡을 수 있을지 주시하고 있다.
