IT/바이오

국산 NPU로 구동한 의료AI…딥노이드 퓨리오사AI, GPU 대체 신호

오예린 기자
입력

국산 AI 반도체가 생성형 의료 AI에 적용돼 실제 병원 진료 환경에서 성능을 검증받는 사례가 처음으로 나왔다. 이미지 생성과 진단 보조 등 고난도 연산이 필요한 생성형 의료 AI를 더 이상 외산 GPU에만 의존하지 않고, 국산 신경망처리장치 기반으로 안정적으로 구동할 수 있음을 보여줬다는 점에서 의료 AI 인프라와 AI 반도체 산업 모두에 적지 않은 파장을 예고하는 결과로 평가된다.

 

딥노이드와 퓨리오사AI는 과학기술정보통신부와 정보통신산업진흥원이 지원하는 AI반도체 응용실증 지원사업을 통해 국산 NPU 기반 생성형 의료 AI 실증을 공동 수행했다. 연구실이 아닌 실제 의료기관에서, 의료진이 일상적으로 사용하는 진료 흐름 속에 시스템을 투입해 실사용 성능과 운영 효율을 검증한 것이 특징이다. 프로젝트의 핵심은 퓨리오사AI의 2세대 AI 반도체 RNGD를 활용해 흉부 엑스레이 판독용 생성형 AI가 GPU 없이도 임상 현장의 요구 수준을 충족할 수 있는지 확인하는 데 맞춰졌다.

이번에 적용된 솔루션은 흉부 X선 영상 판독 보고서를 자동으로 작성해주는 생성형 의료 AI M4CXR이다. 엑스레이 영상 입력 후 수초 내에 판독문 초안을 생성하는 구조로, 대규모 언어모델과 의료 영상 특화 모델을 결합해 결절, 음영 변화, 심장 크기 등 주요 이상 소견을 자연어 형태로 요약해준다. 고도로 병렬화된 행렬 연산이 몰리는 작업 특성상 그동안은 고성능 GPU 인프라에 의존해 왔으나, 이번 실증에서는 동일 수준의 임상 워크플로를 국산 NPU 상에서 구현하는 데 초점을 맞췄다.

 

RNGD는 퓨리오사AI가 개발한 2세대 NPU로, 의료 영상 AI와 생성형 모델에 최적화된 연산 구조를 채택했다. 대량의 텐서 연산을 동시에 처리하는 전용 연산 유닛을 촘촘히 배치해 파라미터 수가 많은 생성형 모델도 지연 시간을 최소화하는 방식이다. 업체 측 설명에 따르면 의료 영상 입력부터 텍스트 보고서 초안 생성까지의 레이턴시를 기존 GPU 환경과 유사한 수준으로 맞추기 위해 연산 스케줄링과 메모리 대역폭 활용을 세밀하게 최적화했다. 특히 X선 판독처럼 실시간성은 아니지만 수초 내 응답이 필수적인 환경에서, 평균 응답 시간을 GPU 대비 체감 차이가 없을 정도로 끌어내린 것이 핵심 성능 개선 지점으로 꼽힌다.

 

의료진 평가는 이러한 목표 달성 여부를 실감나게 보여준다. 이로운 인하대학교병원 영상의학과 교수는 M4CXR이 NPU 기반에서도 흉부 엑스레이 검사 후 수초 내에 판독문 초안을 생성해 실제 외래와 입원 환자 진료 흐름을 거의 방해하지 않는 수준의 응답 속도를 확인했다고 설명했다. 기존 GPU 기반 AI 시스템과 비교했을 때도 응답 속도와 사용감에서 불편함을 느끼지 않을 정도로 충분히 빠르고 안정적으로 동작했다고 평가해 성능 면에서의 차별점 부족 우려를 상당 부분 해소했다.

 

효율성 측면에서도 의료 현장의 체감 이득이 뚜렷하게 나타났다. 반복적인 정상 혹은 경미 소견 작성 시간을 줄여주고, 의료진이 놓치기 쉬운 이상 소견을 다시 확인하는 이중 안전장치 역할을 하면서 업무 효율과 환자 안전을 동시에 끌어올렸다는 설명이다. 이는 국산 NPU 기반 엑스레이 판독 AI 시스템이 단순 파일럿 수준을 넘어, 실제 의료진이 지속적으로 활용할 수 있는 단계에 진입했다는 평가로 이어진다.

 

하드웨어 관점에서 RNGD의 가장 큰 강점으로는 전력 효율이 꼽힌다. 업계 비교 기준으로 사용되는 H100 PCIe 제품의 열설계전력은 350와트 수준인데 비해, 퓨리오사AI RNGD는 180와트 정도로 약 2배 가까운 소비전력 차이를 보인다. 전력 사용량이 줄어들면 칩 발열도 감소해 냉각 인프라 부담이 완화되고, 결과적으로 병원 서버실의 전력 비용과 설비 투자를 장기적으로 줄일 여지가 생긴다. 의료기관 입장에서는 고도화되는 의료 AI 수요에 대응하기 위해 GPU 서버를 무한정 늘리기 어려운 만큼, 전력 대비 성능이 높은 NPU는 현실적인 대안으로 부상할 수 있다.

 

지금까지 생성형 의료 AI 인프라는 대부분 해외 업체 GPU를 중심으로 꾸려져 왔다. 대형 병원과 연구기관의 경우에도 AI 영상판독, 의료 기록 요약, 음성 기반 문진 보조 서비스 등 다양한 AI 워크로드를 한정된 GPU 자원에 나눠 쓰는 구조가 일반적이다. 이번 실증은 국산 NPU가 이러한 구조에서 일부 워크로드를 안정적으로 분담해 줄 수 있음을 보여준 첫 사례라는 점에서 의미가 크다. 특히 영상 판독처럼 데이터 파이프라인과 응답 시간 요구조건이 명확한 업무에 NPU를 할당하고, GPU는 대규모 모델 학습이나 복잡한 시뮬레이션에 집중시키는 혼합 인프라 전략이 병원 IT 부서의 선택지로 부상할 가능성이 커졌다.

 

글로벌 시장에서는 이미 AI 반도체 다변화 흐름이 뚜렷하다. 미국과 유럽에서는 GPU 의존도를 낮추기 위한 전용 AI 가속기와 NPU 개발이 늘고 있고, 클라우드 서비스 사업자들도 자체 설계 칩을 통해 전력 효율과 비용 경쟁력을 강화하는 추세다. 의료 분야 역시 방대한 영상과 기록 데이터를 처리해야 하는 만큼 AI 연산 플랫폼 선택이 병원 디지털 전환의 핵심 변수가 되고 있다. 이런 상황에서 국산 NPU가 의료 현장에서 실증 데이터를 확보했다는 점은 국내 AI 반도체 업계가 글로벌 경쟁 구도에 본격적으로 합류할 수 있는 신호탄으로 해석된다.

 

정책 측면에서도 AI반도체 응용실증 지원사업의 성과는 주목할 만하다. 정부가 예산을 투입해 국산 칩의 실사용 검증 기회를 제공하고, 의료기관과 AI 기업을 매칭함으로써 의료 데이터와 반도체 기술을 연계하는 구조를 만든 셈이다. 향후 식품의약품안전처의 의료 AI 허가 가이드라인과 개인정보보호 규제, 병원 정보시스템 표준 등이 AI 반도체 최적화 방향과 연동된다면, 국산 NPU 기반 의료 AI 솔루션의 상용화 속도는 한층 빨라질 수 있다는 관측도 제기된다.

 

업계에서는 이번 사례가 의료 AI 확산과 국산 AI 반도체 생태계 확장의 교차점이 될 수 있을지에 주목하고 있다. GPU 중심 구조에 대한 기술적 대안이 실증된 만큼, 실제 조달과 운영 단계에서 어떤 선택이 이뤄질지가 향후 수년간의 시장 구도를 좌우할 변수로 떠오르고 있다. 의료계와 산업계, 정책 당국이 전력 효율과 성능, 비용과 규제를 함께 고려하는 균형점을 어떻게 찾느냐가 새로운 성장 기회의 전제가 되고 있다.

오예린 기자
share-band
밴드
URL복사
#딥노이드#퓨리오사ai#rngd