AI모델 경량화로 온디바이스 확산…노타, 국무총리상 수상 파장
인공지능 모델 경량화와 온디바이스 최적화 기술이 소프트웨어 산업의 경쟁지형을 바꾸고 있다. 초거대 AI가 데이터센터에 집중된 구조에서 벗어나, 각종 디바이스에서 직접 AI를 구동하려는 흐름이 빨라지는 가운데 국내 스타트업 노타가 핵심 기술 기업으로 부상했다. 업계에서는 이번 정부 포상이 엣지와 IoT 전반으로 확산되는 이른바 AI 에브리웨어 경쟁의 분기점이 될 수 있다는 평가를 내놓고 있다.
인공지능 모델 경량화 전문 기업 노타의 채명수 대표는 1일 서울 양재 엘타워에서 열린 제26회 소프트웨어산업인의 날 기념식에서 소프트웨어 산업발전 유공자 국무총리 표창을 받았다. 과학기술정보통신부가 주관하는 이 포상은 국내 소프트웨어 산업 혁신과 성장 기반 조성에 기여한 개인과 기관에 수여되는 정부 표창으로, AI 모델 최적화 상용화와 소프트웨어 경쟁력 제고 공로가 공식적으로 인정된 셈이다.

채 대표는 수상 소감에서 모든 디바이스에서 AI가 구동될 수 있게 한다는 AI 에브리웨어 비전을 제시했다. 그는 노타의 기술력을 신뢰하고 함께해 온 구성원과 파트너가 만든 성과라고 강조하면서, AI의 보편화에 가장 크게 기여한 기업으로 자리매김하겠다는 목표를 밝혔다. AI의 보편화라는 메시지는 클라우드 중심에서 디바이스 분산 구조로 옮겨가는 글로벌 AI 아키텍처 변화와 맞닿아 있다는 점에서 주목된다.
노타의 핵심 경쟁력은 자체 개발한 AI 모델 최적화 플랫폼 넷츠프레소에 집중돼 있다. 넷츠프레소는 대규모 AI 모델을 다양한 하드웨어 환경에 맞게 압축하고 경량화하는 소프트웨어 플랫폼이다. GPU 기반 데이터센터부터 모바일 AP, AI 반도체, 초소형 IoT 디바이스까지 지원 범위를 넓혀, 같은 성능을 더 작은 모델과 적은 연산량으로 구현하도록 돕는다. 회사에 따르면 넷츠프레소를 적용할 경우 모델 크기를 최대 90퍼센트 이상 줄이면서도 기존 모델과 동등한 수준의 정확도를 유지하는 것이 가능해, 개발과 운영 비용 부담을 크게 낮춘다.
기술적으로는 파라미터 프루닝과 양자화, 지능형 아키텍처 탐색 등 여러 최적화 기법을 조합해 연산량과 메모리 사용을 최소화하는 전략으로 설계돼 있다. 대규모 언어모델이나 컴퓨터 비전 모델처럼 연산 집약적인 AI에서도 추론 속도 저하를 줄이고, 배터리와 발열 등 엣지 디바이스가 가진 물리적 제약을 보완하는 방향으로 구현되는 점이 특징이다. 특히 기존 클라우드 전용 모델을 재학습 없이 재구성해 현장 장비에 빠르게 올릴 수 있다는 점이, 실제 도입 현장에서의 차별점으로 거론된다.
이 같은 기술을 바탕으로 노타는 글로벌 반도체 생태계와의 협력을 넓혀가고 있다. 엔비디아, 퀄컴, 소니 등 주요 반도체 기업과 함께 AI 모델을 각사 하드웨어에 최적화해 구동하는 프로젝트를 진행 중이며, 고객사 입장에서는 동일한 칩에서 더 많은 AI 기능을 구현하거나, 저전력 라인업으로도 고급 AI 서비스를 제공하는 선택지가 생긴다. 엣지 컴퓨팅 수요가 커지는 상황에서 칩 공급사와 소프트웨어 최적화 기업 간 협업은 필수 축으로 꼽힌다.
노타는 생성형 AI를 접목한 지능형 영상 관제 솔루션 노타 비전 에이전트도 산업 현장에 확대 공급하고 있다. 노타 비전 에이전트는 카메라나 엣지 서버에 탑재된 경량 모델로 영상 내 객체 인식, 이상 행동 감지, 안전 규정 위반 탐지 등을 수행하는 솔루션이다. 건설 현장에서는 중장비 사각지대 인명사고 예방, 제조 라인에서는 작업자 안전 모니터링과 불량 검출, 교통 분야에서는 교차로 혼잡도 분석과 사고 위험 상황 탐지, 리테일에서는 매장 동선 분석과 매대 진열 모니터링 등으로 활용 범위를 넓혀가고 있다. 특히 온디바이스 분석 구조를 채택함에 따라 대규모 영상 데이터를 클라우드로 전송하지 않고도 실시간 판단이 가능해, 네트워크 비용과 개인정보 유출 위험을 동시에 줄일 수 있다는 평가를 받고 있다.
국가 차원의 AI 전환 전략에서도 노타의 역할은 커지고 있다. 노타는 정부가 추진 중인 AI 국가대표 프로젝트에서 독자 AI 파운데이션 모델 개발을 담당하는 정예 기업으로 선정돼, 국가 AI 기술 주권 확보를 위한 기반 모델 개발에 참여하고 있다. 초거대 언어모델과 멀티모달 모델이 국가 인프라 성격을 띠기 시작한 상황에서, 이를 경량화해 공공과 산업 현장에 실제 배치하는 역량은 정책 측면에서도 중요한 축이 되고 있다는 분석이 나온다.
산업통상자원부가 주도하는 M.AX 얼라이언스에서도 노타는 가전과 자율주행 분야의 AI 최적화 기술 공급사로 참여 중이다. 생활가전에서는 에너지 효율과 사용자 경험을 높이는 엣지 AI, 차량 분야에서는 전방 카메라와 라이다 데이터를 현장에서 처리하는 자율주행 보조 기능이 주요 적용 타깃이다. 노타는 특히 국산 반도체 기업들과의 협력을 통해 차량과 로봇 등 다양한 산업용 플랫폼에서 구동 가능한 AI 모델을 개발하고, 국내 칩을 기반으로 한 온디바이스 AI 경쟁력 강화에 힘을 싣고 있다.
글로벌 시장에서는 이미 온디바이스 AI와 경량화 기술을 둘러싼 경쟁이 본격화된 상황이다. 미국과 유럽 주요 기업들은 모바일 칩과 엣지 가속기에 특화된 소프트웨어 스택을 구축하며 하드웨어 중심 전략을 펴고 있다. 이런 가운데 노타처럼 특정 칩에 종속되지 않는 범용 최적화 플랫폼을 가진 기업은 다양한 파트너와 연계할 수 있다는 점에서 전략적 유연성이 크다는 평가를 받는다. 다만 초거대 모델의 급속한 진화 속도와 각국의 데이터 규제가 변수로 작용할 수 있어, 경량화 기술도 지속적인 고도화가 요구되는 상황이다.
AI 모델을 실제 서비스와 산업 현장에 적용하려면 연산 자원, 전력, 지연 시간뿐 아니라 개인정보 보호와 보안, 인증 등 규제 환경도 함께 고려해야 한다. 온디바이스 처리 비중이 늘어날수록 데이터가 외부 서버로 이동하지 않는 장점이 부각되지만, 디바이스 자체의 보안 취약점과 소프트웨어 업데이트 체계는 새로운 과제가 될 수 있다. 정부가 디지털플랫폼 정부, 스마트팩토리, 자율주행 인프라 등 국가 프로젝트를 추진하는 과정에서, 경량화와 온디바이스 AI를 제도 설계에 어떻게 반영할지가 향후 쟁점으로 떠오를 가능성도 있다.
업계에서는 노타의 이번 국무총리상 수상이 국내 AI 산업 지형에서 온디바이스와 최적화 기술이 차지하는 전략적 비중이 높아지고 있음을 보여주는 신호로 보고 있다. 한 소프트웨어 업계 관계자는 모델 경량화와 최적화는 눈에 잘 띄지 않는 인프라 기술이지만, AI 서비스를 실제로 돌아가게 만드는 핵심 동력이라며, 향후 산업 전반의 AI 내재화 속도를 좌우하는 요소가 될 수 있다고 말했다. 산업계는 노타를 포함한 경량화 기술 기업들이 공공과 민간 영역에서 AI 에브리웨어 비전을 어디까지 실현할지 주시하고 있다.
