NPU로 대규모 AI 구동 노린다…노타·퓨리오사AI, 최적화 동맹
인공지능 경량화와 최적화 기술이 AI 반도체와 결합하며 차세대 고성능 저전력 컴퓨팅 경쟁에 불을 지피고 있다. 국내 AI 소프트웨어 기업 노타와 AI 반도체 기업 퓨리오사AI가 전략적 업무협약을 맺고 NPU 기반 AI 기술 협력에 나서면서, 대규모 AI 모델을 효율적으로 구동하려는 산업계 수요에 대한 대응이 본격화되는 모습이다. 업계에서는 국산 NPU와 최적화 소프트웨어의 결합을 향후 엣지 AI와 데이터센터 시장 주도권을 가를 분기점으로 바라보는 분위기다.
노타와 퓨리오사AI는 1일 NPU 기반 AI 기술 협력을 위한 전략적 업무협약을 체결했다고 밝혔다. 협약의 핵심은 퓨리오사AI의 NPU 하드웨어와 노타의 AI 경량화·최적화 소프트웨어를 결합해, 제한된 전력 환경에서도 복잡한 대규모 AI 모델을 높은 속도로 안정적으로 실행하겠다는 구상이다. 양사는 AI 솔루션 공동 개발과 사업화, 기술 파트너십 확대, 공동 프로젝트를 통한 기술 및 사업성 검증을 추진하기로 했다.

NPU는 인공지능 신경망 연산에 특화된 반도체로, 행렬 곱셈과 같은 딥러닝 핵심 연산을 병렬로 처리해 GPU 대비 전력당 추론 성능을 극대화하는 것이 특징이다. 특히 데이터센터뿐 아니라 차량, 로봇, 산업용 장비 등 엣지 디바이스에 탑재되려면 전력 소모를 줄이면서도 연산 지연을 최소화해야 한다. 이번 협력의 의미는 이런 요구를 국내 기술 조합으로 해결하겠다는 점에 있다.
노타는 양사 협업을 통해 퓨리오사AI NPU 위에서 대규모 AI 모델을 더 적은 메모리와 전력으로 구동할 수 있도록 모델 경량화, 연산 최적화, 하드웨어 특화 컴파일 기술 등을 제공할 계획이다. 모델 양자화와 프루닝, 연산 그래프 재구성 같은 기술을 적용해 성능 저하 없이 파라미터 수와 연산량을 줄이는 방식이다. 회사 측은 이를 통해 퓨리오사AI NPU의 전력 효율과 추론 속도를 동시에 끌어올려, 동일한 칩으로 더 많은 AI 워크로드를 처리할 수 있도록 돕겠다는 방침이다.
퓨리오사AI는 자사 2세대 NPU 칩 RNGD를 중심으로 다양한 최신 AI 모델을 빠르게 지원하는 생태계를 넓히겠다는 전략이다. RNGD는 대규모 언어모델과 컴퓨터 비전, 멀티모달 등 복합 워크로드를 겨냥한 차세대 AI 추론용 칩으로, 데이터센터급 성능과 전력 효율을 동시에 추구하는 구조를 채택한 것으로 알려져 있다. 노타의 최적화 기술이 결합될 경우 모델별 커스텀 튜닝을 통해 RNGD의 효율이 한층 높아질 것으로 예상된다.
양사는 이번 협력을 단순한 기술 통합을 넘어, 실제 산업 현장에서 검증되는 실증 모델 구축으로 확장할 계획이다. 우선 로봇과 모빌리티 분야를 핵심 타깃으로 삼고, 자율주행과 고급 운전자 보조, 물류 로봇, 서비스 로봇 등에서 요구되는 실시간 추론 성능과 전력 제약을 동시에 만족하는 레퍼런스 솔루션을 만든다는 구상이다. 양사는 이를 기반으로 국내외 파트너사와의 협력도 넓혀, 글로벌 AI 반도체·플랫폼 시장 진출에 속도를 낼 계획으로 보인다.
국제적으로는 미국과 중국을 중심으로 GPU와 NPU를 결합한 AI 가속기 경쟁이 치열해지는 상황에서, 국내에서도 반도체와 소프트웨어의 수평적 분업이 아닌 수직적 통합 전략이 가속되는 모습이다. 글로벌 대형 클라우드 사업자와 빅테크 기업들이 자체 AI 칩 개발과 최적화 소프트웨어를 동시에 확보하며 생태계 주도권을 강화하는 가운데, 노타와 퓨리오사AI의 협력은 국내에서도 유사한 통합 모델을 구축하려는 시도로 해석된다.
채명수 노타 대표는 양사 협력이 국내 반도체 경쟁력 측면에서도 의미가 있다고 강조했다. 그는 AI 최적화 기술로 퓨리오사AI NPU의 전력 효율과 추론 성능을 극대화해 대규모 AI 모델의 안정적인 구동을 지원하겠다고 말했다. 백준호 퓨리오사AI 대표는 AI 워크로드 고도화에 따라 추론 인프라의 성능과 효율성 요구가 더욱 커질 것이라며, 노타와의 협력을 통해 RNGD 기반으로 다양한 최신 AI 모델을 더 신속하고 효율적으로 지원할 수 있게 됐다고 평가했다.
업계에서는 국내 AI 반도체와 최적화 소프트웨어의 결합이 실제 수요처에서 검증될 경우, 향후 정부의 AI 인프라 구축 사업과 기업들의 자체 데이터센터 확충 과정에서 선택지로 부상할 가능성에 주목하고 있다. 동시에 글로벌 시장에서 이미 진행 중인 GPU 중심 구조에 어떻게 균열을 낼 수 있을지, 그리고 국내 NPU 생태계가 독자적인 경쟁력을 확보할 수 있을지가 향후 관전 포인트로 거론된다. 산업계는 이번 협력이 국산 AI 반도체와 소프트웨어 조합이 실제 시장에 안착하는 출발점이 될지 예의주시하고 있다.
