온디바이스 생성형 AI 가속…노타, 엑시노스 2600 최적화
온디바이스 인공지능이 모바일 반도체 경쟁의 새 축으로 부상한 가운데, 국내 AI 모델 경량화 기업 노타가 삼성전자의 차세대 모바일 애플리케이션 프로세서 엑시노스 2600의 AI 성능을 높이는 핵심 파트너로 다시 합류했다. 생성형 AI를 단말기에 직접 올리려는 글로벌 스마트폰 제조사의 움직임이 빨라지는 상황에서, 칩 설계와 경량화 소프트웨어를 결합하는 이 같은 협력이 향후 모바일 AP 시장의 기술 구도에 적지 않은 파급력을 줄 것으로 관측된다.
노타는 자사의 AI 모델 최적화 플랫폼 기술을 삼성전자 차세대 모바일 AP 엑시노스 2600에 공급하는 계약을 체결했다고 30일 밝혔다. 엑시노스 2400과 2500에 이어 세 세대 연속으로 툴체인 고도화에 참여하게 되면서, 노타의 경량화 기술이 삼성의 온디바이스 AI 전략에 사실상 표준 도구로 자리 잡는 흐름으로 보인다.

노타가 제공하는 넷츠프레소 플랫폼은 AI 모델의 파라미터 수와 연산량을 크게 줄이면서도 정확도 저하를 최소화하는 것이 특징이다. 회사 측에 따르면 모델 크기를 최대 90퍼센트 이상 축소하면서도 목표 정확도를 유지하도록 설계할 수 있어, 모바일 AP와 같은 제약된 하드웨어에서도 대규모 AI 모델을 구동할 수 있게 해준다. 기존에는 클라우드 서버에 두던 생성형 AI 모델을 단말기 내부로 이전해도 사용자 체감 성능을 유지하는 것이 핵심 차별점으로 꼽힌다.
이번 계약에서 노타는 삼성전자의 AI 모델 최적화 툴체인인 엑시노스 AI 스튜디오의 차세대 버전 개발에 참여한다. 엑시노스 AI 스튜디오는 개발자가 다양한 딥러닝 프레임워크로 만든 모델을 엑시노스 AP 환경에 맞게 변환하고 최적화하는 도구로, 연산 단위 재배치, 정수 양자화, 연산자 병합 등 하드웨어 친화적인 변환 과정을 자동으로 수행한다. 노타의 넷츠프레소 기술이 결합되면 이 최적화 파이프라인 전반이 자동화 수준을 한 단계 높여, 개발자가 별도 수작업 튜닝 없이도 최신 생성형 모델을 칩에 맞게 경량화할 수 있을 것으로 예상된다.
특히 양측은 대규모 생성형 AI 모델을 엑시노스 2600에서 실시간에 가깝게 구동하기 위한 정밀도 보존 기술에 주력하고 있다. 생성형 모델은 언어, 이미지, 멀티모달 등 복합 입력을 처리하는 구조여서 메모리 사용량과 연산량이 폭발적으로 증가한다. 노타는 가중치 공유, 구조적 프루닝, 혼합 정밀도 양자화와 같은 고도화된 경량화 기법을 통해 메모리 사용량과 지연 시간을 줄이면서도 응답 품질을 최대한 유지하는 방식으로 접근하고 있다. 업계에서는 이러한 방식이 기존 모델 대비 속도와 효율을 2배 이상 높일 수 있는 여지가 있는 것으로 보고 있다.
시장 측면에서 온디바이스 생성형 AI 경쟁은 이미 글로벌 스마트폰 제조사와 AP 설계사 사이에서 본격화된 상태다. 미국과 대만의 주요 칩 업체들은 NPU와 AI 전용 가속기를 확장해 고해상도 이미지 생성, 실시간 음성 비서, 기기 내 번역 등 기능을 전면에 내세우고 있다. 여기에 노타와 삼성전자가 추진하는 경량화 결합 전략은 동일한 트랜지스터 예산 안에서 더 큰 모델을 수용하게 해, 전력 소모와 발열을 억제하면서도 사용자 경험을 끌어올리는 방향으로 경쟁 우위를 노리는 포석으로 읽힌다.
사용자 관점에서 보면, 온디바이스 방식은 응답 속도와 개인정보 보호 측면에서 매력이 크다. 데이터가 클라우드로 전송되지 않아 네트워크 지연에 영향을 덜 받고, 음성 명령이나 개인 일정과 같은 민감 정보가 단말기를 벗어나지 않아 프라이버시 우려를 줄일 수 있다. 특히 이동 통신 환경이 불안정한 지역에서도 일정 수준의 생성형 AI 기능을 안정적으로 쓸 수 있어, 스마트폰·태블릿뿐 아니라 웨어러블, 가전, 차량용 인포테인먼트 시스템 등으로 활용 범위가 넓어질 가능성도 있다.
경쟁 구도 측면에서는 칩 자체의 연산 성능뿐 아니라 소프트웨어 툴체인과 최적화 생태계가 차별화 요소로 부상하는 양상이다. 미국과 유럽의 일부 업체는 자체 최적화 컴파일러와 프레임워크를 통해 자사 칩에 특화된 AI 배포 환경을 만들고 있다. 삼성전자는 엑시노스 AI 스튜디오에 외부 전문기업의 기술을 결합해 개발자 사용성을 끌어올리는 전략을 선택한 셈이다. 특히 노타가 모바일을 넘어 로보틱스, 자율주행, 의료, 스마트시티로 납품처를 확대해온 만큼, 엑시노스 2600 기반 기기 외에 다른 하드웨어에서도 공통적으로 활용 가능한 최적화 경험치를 축적할 수 있다는 점이 중장기 경쟁력으로 작용할 수 있다.
온디바이스 생성형 AI 확산은 정책과 규제 측면에서도 새로운 논점을 낳고 있다. 클라우드 의존도가 낮아지면 국가별 데이터 국경 규제와 클라우드 보안 규제의 직접 영향은 줄어드는 대신, 단말기 내에서의 개인정보 처리 안전성, 칩 단계의 보안 기능 요구 수준이 높아질 수 있다. 아직까지 엑시노스 2600에 대한 구체적인 규제 이슈는 언급되지 않았지만, 향후 생성형 AI 기반 디지털 헬스케어나 교육 서비스에 탑재될 경우 각국 개인정보 보호 법제, 의료 기기 소프트웨어 규정과의 정합성이 쟁점이 될 수 있다는 관측도 나온다.
채명수 노타 대표는 엑시노스 2400부터 이어져온 협력이 노타 기술의 상용 가치를 입증하는 사례라고 평가했다. 노타는 지난 10여 년간 쌓은 모델 경량화와 최적화 노하우를 바탕으로 모바일, 로봇, 가전, 자율주행, 의료, 교육, 스마트시티 등 다양한 산업군에서 온디바이스 AI 프로젝트를 진행해 왔다. 회사 측은 글로벌 제조사 제품에 탑재된 사례가 늘어나며 단순 기술 검증을 넘어 매출과 양산 성과로 이어지고 있다고 설명한다.
업계에서는 향후 엑시노스 2600이 실제 양산 기기에 탑재되는 시점이 온디바이스 생성형 AI 경쟁의 새로운 분기점이 될 수 있다고 본다. 칩과 모델 최적화 기술이 얼마나 유기적으로 결합해 실사용 경험을 끌어올릴지가 관전 포인트로 거론된다. 산업계는 이번 협력이 온디바이스 AI 기술을 주류 스마트 디바이스 시장에 안착시키는 계기가 될지 주시하고 있다.
