IT/바이오

네이버 더스터2 애니 공개…공간지능 로봇 상용화 가속

한유빈 기자
입력

네이버가 차세대 3차원 복원 인공지능과 가상 인체 모델을 앞세워 로봇 공간지능 경쟁에 속도를 올리고 있다. 한 장의 사진으로 공간을 입체적으로 이해하는 3D 비전 모델과 전 세계 인체 통계를 반영한 3D 바디모델을 조합해, 로봇이 사람과 공간을 동시에 이해하는 파운데이션 모델 구축을 노리는 전략이다. 업계에서는 로봇이 실내외 어디서나 사람의 행동과 사회적 맥락까지 파악하는 기술 경쟁이 본격화되는 분기점으로 보는 시각이 나온다.  

 

네이버에 따르면 프랑스 그르노블에 위치한 네이버랩스 유럽은 20일과 21일 현지에서 제4회 AI 포 로보틱스 워크숍을 열고 차세대 3D 복원 AI 더스터2와 3D 바디모델 애니를 공개했다. 이 행사는 2019년부터 2년마다 개최되는 로보틱스와 인공지능 분야 국제 워크숍으로, 올해는 공간지능을 주제로 전 세계 연구자 150여 명이 모였다. 공간지능 개념을 처음 제안한 임페리얼 칼리지 런던의 앤드류 데이비슨 교수를 비롯해 다수의 연구진이 최신 성과를 공유했다.  

더스터는 2023년 12월 처음 공개된 3D 비전 모델로, 단일 이미지로부터 장면의 깊이와 구조를 추정해 3차원 공간을 재구성하는 기술이다. 기존 로봇 내비게이션은 사전에 제작된 지도를 기반으로 경로를 계획하는 방식이 일반적이었다. 여기에 더스터를 적용하면 지도 없이도 로봇 탑재 카메라가 찍은 한 장의 사진만으로 주변 공간의 입체 구조를 파악하고 이동 계획을 세울 수 있다. 로봇 배치 전에 대규모 지도 구축 공정이 필요했던 점을 줄여, 환경 적응 속도를 높이는 접근이다.  

 

이번에 공개된 더스터2는 초기 모델 이후 등장한 다양한 파생 연구를 통합하고 실제 서비스 도입을 고려해 설계된 차세대 버전이다. 학습 데이터 구성과 네트워크 구조를 업그레이드해 공간 복원 정확도와 속도를 동시에 끌어올린 것으로 전해진다. 물체와 사람, 배경이 혼재된 복잡한 환경에서도 3D 구조를 더 안정적으로 추론하도록 최적화하는 한편, 로봇 하드웨어에 탑재하기 위한 경량화와 추론 효율 개선도 진행 중인 것으로 알려졌다. 네이버는 이 기술을 로보틱스뿐 아니라 증강현실과 가상현실, 디지털 트윈, 스마트시티 등 공간 정보를 다루는 다양한 산업 영역으로 확장할 수 있다는 점에 주목하고 있다.  

 

3D 바디모델 애니는 사람의 신체를 수치화된 파라미터로 정밀하게 표현하는 인체 모델이다. 신장, 체형, 연령에 따른 신체 비율 변화 등 다양한 변수를 조합해 유아부터 노인까지 전 연령대의 인체를 가상 환경에서 재현할 수 있다. 네이버랩스 유럽은 메이크휴먼 커뮤니티가 축적한 인체 계측 데이터와 세계보건기구 인구 통계를 활용해 각 지역과 연령대의 체형 분포를 반영했다. 실제 개인의 생체 정보를 수집하지 않고도 통계 기반 인체 모델을 구축해 개인정보 침해 우려를 줄인 점이 특징으로 평가된다.  

 

연구진은 애니를 통해 로봇이 사람의 자세와 움직임을 보다 정확히 추정하고, 다양한 체형의 사람들과 자연스럽게 상호작용하는 알고리즘을 개발하고 있다. 예를 들어 로봇이 군중 속에서 어린이와 성인을 구분해 이동 경로를 달리 설정하거나, 노인의 보행 속도에 맞춰 옆을 따라가는 행동을 학습시키는 식이다. 애니는 이달 6일 오픈소스로 공개돼 학계와 산업계에서 자유롭게 활용할 수 있게 됐다. 로봇, 게임, 영화 VFX 등 인체 움직임이 중요한 여러 분야에서 실험과 응용 연구가 확대될 여지가 생겼다는 평가가 나온다.  

 

특히 더스터2와 애니의 조합은 로봇이 공간과 사람을 동시 인식하는 토대를 제공한다는 점에서 주목된다. 더스터2가 제공하는 장면 단위 3D 구조 정보에 애니가 표현하는 사람의 자세와 동작, 체형 정보를 결합하면 로봇은 주변 공간의 구조뿐 아니라 그 안에서 사람이 어떻게 움직이고 상호작용하는지까지 추론할 수 있다. 네이버는 이러한 공간지능 기술을 적용하면 로봇이 사람의 생활 패턴과 사회적 규범을 더 깊이 이해해, 한 단계 높은 사회적 행동과 서비스를 수행할 수 있을 것으로 보고 있다.  

 

예를 들어 복도에서 대화 중인 사람들을 인식한 로봇이 이들 사이를 통과하지 않고 거리를 유지하며 우회 이동하거나, 여러 사람 가운데 자신을 부르는 사람의 위치와 시선을 파악해 적절히 응답하는 시나리오가 가능해진다. 단순 충돌 회피를 넘어, 개인 공간을 존중하고 군중 흐름을 방해하지 않는 등 사회적 규범을 반영한 이동 전략을 학습시킬 수 있다는 설명이다. 이런 기술은 사무실과 쇼핑몰, 병원, 공공시설 등 사람 밀집 공간에서 서비스 로봇 도입을 확대하는 데 핵심 역할을 할 수 있다.  

 

국제 경쟁 측면에서 보면 글로벌 로봇 기업과 빅테크는 저마다 3D 비전과 인체 인식 기술을 고도화하며 생활밀착형 로봇 시장을 노리고 있다. 미국과 유럽에서는 가정용 휴머노이드와 물류 자동화 로봇에 3D 인지 모델을 접목하는 시도가 이어지고 있고, 실시간 다중 인체 포즈 추정을 통해 로봇이 작업자의 움직임을 이해하고 협업하는 연구도 활발하다. 네이버랩스 유럽이 파운데이션 모델을 전면에 내세운 것은 특정 서비스나 하드웨어에 국한되지 않는 범용 공간지능 엔진을 선점하겠다는 전략으로 해석된다.  

 

프랑스 그르노블 연구소는 로봇이 세상을 이해하기 위한 여러 비전, 인체, 환경 모델을 하나로 통합한 범용 파운데이션 모델을 개발 중이다. 목표는 로봇이 사전에 정의된 규칙을 넘어 사회적 맥락을 해석하고, 예측하지 못한 환경 변화에도 유연하게 대처하는 것이다. 일례로 레이아웃이 바뀐 사무실이나 공사 중인 지하철역처럼 기존 지도 정보가 무용지물이 된 상황에서도, 로봇이 스스로 3D 환경을 재구성하고 주변 사람들의 움직임을 고려해 안전하게 동선을 계획하는 기능이 여기에 포함될 수 있다.  

 

네이버랩스는 국내외 테스트베드를 통해 이러한 공간지능 기술을 반복 검증하고 있다. 한국에서는 네이버 사옥 1784를 비롯한 다양한 실증 공간에서 자율주행 로봇과 실내 배송, 안내 서비스 등을 운영하며 데이터를 축적했다. 물류 동선 최적화, 엘리베이터 연동, 보안 시스템과의 연계 같은 실제 운영 요소까지 포함한 테스트를 이어가며 로봇 상용화에 필요한 요구사항을 기술 개발 과정에 반영하고 있다는 설명이다.  

 

마틴 휴멘버거 네이버랩스 유럽 연구소장은 워크숍에서 네이버랩스의 공간지능 연구 방향을 소개했다. 그는 새로운 파운데이션 모델 개발과 기존 모델의 개선 및 통합을 통해, 비전문가도 실제 환경에서 손쉽게 활용할 수 있는 공간지능 기반을 구축해 나가고 있다고 밝혔다. 복잡한 로봇 지식 없이도 기업과 개발자가 공간지능 기능을 서비스에 연동할 수 있는 플랫폼 형태까지를 염두에 두고 있는 것으로 풀이된다.  

 

이동환 네이버랩스 리더는 물리공간과 가상공간을 연결하는 자사 기술이 로봇, 증강현실, 가상현실, 스마트시티 등 영역에서 실제 서비스로 이어지는 사례와 향후 비전을 공유했다. 그는 네이버랩스가 2016년부터 공간지능과 물리지능 연구에 집중해 왔으며, 국내외 테스트베드에서 기술을 실증하고 상용 서비스에 적용해 온 경험을 바탕으로 로봇을 위한 인공지능 연구 개발을 강화하겠다고 말했다.  

 

업계에서는 더스터2와 애니로 대표되는 네이버의 공간지능 기술이 향후 로봇 대중화 시대의 핵심 인프라 역할을 할 수 있을지 주목하고 있다. 로봇이 장소와 환경에 구애받지 않고 작동하면서도, 사람과의 상호작용에서 사회적 규범과 안전을 동시에 충족해야 하는 요구가 커지고 있어서다. 기술과 윤리, 산업과 제도 간 균형을 어떻게 맞추느냐가 공간지능 기반 로봇 생태계의 새로운 성장 조건이 되고 있다.

한유빈 기자
share-band
밴드
URL복사
#네이버#더스터2#애니