GPU 구독형 서비스 확산…KT, 충북대로 AI 인프라 높여 산업자본 바꿀까
고성능 GPU를 구독형으로 제공하는 서비스가 국내 인공지능 인프라 구축 방식을 바꾸고 있다. KT가 엔비디아 H100 기반 GPUaaS를 대학 산학협력단에 공급하며 첫 레퍼런스를 확보하면서, 초기 투자비 부담 없이 AI 개발 환경을 도입하려는 수요가 본격적으로 가시화된 모습이다. 업계에서는 이번 계약을 계기로 통신사와 클라우드 사업자의 GPU 구독 경쟁이 한층 가속화될 것으로 보고 있다.
KT는 4일 충북대 산학협력단 강소특구 지원센터에 고성능 그래픽 처리장치 구독형 서비스 K GPUaaS를 제공한다고 밝혔다. K GPUaaS는 KT가 확보한 엔비디아 GPU H100을 월간 구독 형태로 이용하는 클라우드 기반 서비스로 2024년 9월 공식 출시됐다. 이용 기관은 물리 서버 도입이나 데이터센터 구축 없이 네트워크를 통해 GPU 자원을 할당받아 사용할 수 있다.

KT는 충북청주강소특구를 첫 적용 사례로 삼았다. 충북청주강소특구는 충북대가 운영하는 기술 핵심 연구기관으로, 스마트 IT 부품과 시스템을 특화 분야로 삼고 있다. KT는 이 센터에 K GPUaaS를 도입해 AI 개발과 학습에 최적화된 고성능 GPU 컴퓨팅 환경을 제공하고 있다. GPU 인프라 제공을 넘어 활용 전략 수립을 위한 전문 컨설팅과 산학 연계를 위한 오픈 이노베이션 프로그램도 함께 지원해 AI 기반 사업화까지 연계한다는 구상이다.
기술적으로 K GPUaaS의 핵심은 엔비디아 H100급 GPU와 이를 묶는 네트워크 구조에 있다. H100은 대규모 언어모델과 생성형 AI 학습에 널리 쓰이는 고성능 GPU로, 일반 서버 CPU 대비 행렬 연산과 병렬 처리에서 수십 배 이상의 성능을 제공하는 것으로 알려져 있다. KT는 이 GPU를 클러스터 형태로 구성하고, 연구자나 기업이 필요 시점에 원하는 규모만큼 자원을 빌려 쓰는 구조로 설계했다.
특히 이번 서비스는 기존 온프레미스 구축 방식의 한계를 줄였다는 평가가 나온다. AI 개발 조직이 자체적으로 데이터센터와 GPU 서버를 도입할 경우 수십억 원대 초기 투자와 상시 운영 인력이 필요하지만, GPUaaS는 월 단위 비용으로 전환해 부담을 분산시킨다. 프로젝트 규모에 따라 GPU 수량을 확장하거나 축소할 수 있어, 사용량 편차가 큰 연구 개발 환경에 적합하다는 분석도 나온다.
K GPUaaS의 인프라는 초고속 통신 기술인 인피니밴드 기반으로 구성됐다. 인피니밴드는 GPU 서버 간 초저지연 통신을 제공하는 네트워크 기술로, 대규모 분산 학습에 필수적인 것으로 평가된다. KT는 인피니밴드로 노드를 엮어 수십 개 이상의 GPU를 하나의 논리적 자원처럼 운용할 수 있도록 해, 파라미터 수가 큰 초거대 언어모델 학습에도 대응할 수 있다고 설명한다.
GPU 가상화 분할 기술도 차별점으로 제시된다. 하나의 GPU를 여러 단위로 쪼개 서로 다른 작업에 할당하는 방식으로, GPU 전체를 필요로 하지 않는 중소 규모 모델 학습이나 추론 작업에서 자원 낭비를 줄인다. 예를 들어 단일 H100이 7개 가상 GPU로 분할될 경우, 7개의 개별 프로젝트나 서비스가 동시에 자원을 공유해 사용할 수 있어, 동일 인프라 대비 활용률을 높일 수 있다.
KT는 데이터 주권 측면도 강조했다. K GPUaaS의 모든 GPU 인프라와 저장 데이터, 네트워크를 국내 데이터센터에서 운영하며, 고객 데이터가 해외로 이전되지 않도록 설계했다. 국내 공공기관과 의료기관, 금융사 등은 민감 데이터의 국외 이전에 엄격한 규제를 받기 때문에, 국내 리전에 한정된 GPU 클라우드는 도입 장벽을 낮추는 요소로 작용할 수 있다는 것이 업계 시각이다.
이번 충북대 산학협력단 공급은 구독형 GPU 서비스의 활용 범위를 교육과 연구 영역까지 넓혔다는 점에서 의미가 크다. 대학 연구진과 스타트업, 강소특구 입주 기업들은 양자역학 시뮬레이션, 반도체 공정 최적화, 바이오 헬스케어 AI 분석 등 고성능 연산을 필요로 하지만, 개별적으로 H100급 GPU를 도입하기에는 비용과 운영 부담이 컸다. GPUaaS 도입으로 이들 기관의 AI 실험과 시제품 개발 속도가 빨라질 수 있다는 기대가 나온다.
글로벌 시장에서는 이미 GPU 클라우드 경쟁이 본격화된 상황이다. 미국에서는 대형 클라우드 사업자를 중심으로 H100, B100 등 최신 GPU를 묶은 AI 전용 클러스터 서비스가 확대되고 있으며, 스타트업과 연구기관을 대상으로 한 시간제·월 구독형 모델이 자리 잡았다. 한국에서는 GPU 수급난과 비용 부담으로 대규모 도입이 지연돼 왔지만, 통신사와 클라우드 기업이 선제적으로 GPUaaS 공급에 나서면서 격차를 줄이려는 움직임이 관측된다.
시장성 측면에서 K GPUaaS는 AI 딥러닝 모델 학습과 추론, 대규모 데이터 분석, 시뮬레이션 등 고성능 연산이 필요한 전 산업 분야를 타깃으로 한다. 제조업의 불량 예측, 금융권의 리스크 분석, 병원의 의료 영상 판독 지원 등 실제 서비스 현장에 투입될 모델을 빠르게 학습해야 하는 수요가 늘고 있기 때문이다. GPUaaS는 하드웨어 소유보다 사용에 초점을 맞추는 방식으로, AI 인프라를 일종의 공공재처럼 공유하는 모델로 확장될 여지도 있다.
다만 규제와 제도 측면에서 고려해야 할 부분도 존재한다. 고성능 GPU 클러스터에 대규모 학습 데이터를 올릴 경우, 개인정보 비식별 조치와 데이터 국외 이전 규정 준수 여부가 관건이 된다. 공공·의료 데이터는 사전 심의와 보안 인증을 거쳐야 하며, 일부 영역에서는 물리적으로 분리된 전용망 사용 요구가 계속되고 있다. GPUaaS 사업자는 정보보호 관리체계 인증과 클라우드 보안 인증 등 다양한 규제 요건을 충족해야 시장 확대가 가능하다는 지적도 나온다.
KT는 충북대 산학협력단 사례를 시작으로 국내 기업과 공공기관 전반으로 K GPUaaS 공급을 확대할 계획이다. 제조, 금융, 유통 등 산업별 특화 AI 모델 개발에 필요한 GPU 인프라를 패키지로 제공하고, 파트너사와의 협력 프로그램을 통해 애플리케이션 레벨까지 묶는 구상을 검토 중인 것으로 알려졌다. 통신 인프라를 기반으로 한 엣지 컴퓨팅 연계 서비스도 장기 과제로 거론된다.
유서봉 KT 엔터프라이즈부분 인공지능전환사업본부장은 K GPUaaS의 첫 레퍼런스를 확보하며 구독형 GPU 시장 확대를 위한 기반을 마련했다고 평가했다. 이어 더 많은 고객이 비용 부담 없이 고성능 GPU와 분산 학습에 최적화된 환경을 이용할 수 있도록 지원해 국내 AI 개발 생태계 활성화에 기여하겠다고 강조했다. 산업계는 GPUaaS가 AI 인프라의 새로운 표준으로 안착할 수 있을지 주시하고 있다.
