"영상 보며 넘어지는 법 학습"…에임인텔리전스, 로봇 실패데이터 만든다
영상 속 인간의 움직임을 분석해 로봇에게 실패를 미리 가르치는 기술이 등장하며 피지컬 AI 안전 개념이 한 단계 진화하고 있다. 인공지능 안전 스타트업 에임인텔리전스가 LG전자, 미국 로봇 운영체제 기업 오픈마인드와 함께 선보인 비디오투로봇 파이프라인은 실제 로봇을 위험에 노출하지 않고도 낙상과 충돌을 학습시켜, 물리 환경에서의 AI 활용 방식을 바꿀 신호탄으로 주목받는다. 업계에서는 이 기술을 로봇 안전 경쟁의 새로운 분기점으로 보는 분위기다.
에임인텔리전스는 26일 영상 속 인간의 동작을 로봇 학습 데이터로 변환하는 엔진 비디오투로봇을 공개했다. 이 기술은 사람이 찍힌 일반 영상이나 시뮬레이션 영상에서 동작과 자세 변화를 추출한 뒤, 로봇이 이해할 수 있는 모션 데이터로 자동 변환하는 파이프라인 구조를 취한다. 특히 로봇이 넘어지거나 부딪히는 상황을 직접 재현하지 않아도, 고위험 상황에 대한 방어 동작과 회피 전략을 사전에 학습시킬 수 있다는 점이 핵심이다.

기술 구현 방식은 멀티모달 생성형 AI에 기반한다. 비오와 소라 등 생성형 모델을 활용해 다양한 환경과 조건에서의 인간 동작 영상을 만들어내고, 이를 로봇 관절과 센서 입력에 맞는 형식으로 변환하는 구조다. 기존에는 실제 로봇을 급경사 지형에 올리거나, 무거운 물체를 일부러 불안정하게 다루는 식의 실험을 통해 데이터를 수집해야 했지만, 이제는 영상 합성과 동작 추출 알고리즘만으로도 유사한 학습 데이터를 대량 확보할 수 있게 된 셈이다.
특히 이번 기술은 기존 로봇 학습에서 가장 취약했던 부분인 실패 데이터, 즉 낙상과 충돌, 균형 붕괴 상황을 정교하게 모델링하는 데 초점을 맞췄다. 사람과 근접 상호작용 중 팔이 걸리거나, 급경사에서 발을 헛디디는 경우, 고하중 물체를 들다 중심이 무너지는 상황 등 현실에서는 연출하기 어려운 장면을 합성 영상과 시뮬레이션으로 구성하고, 이를 안전한 학습 데이터로 치환하는 방식이다. 에임인텔리전스는 이러한 접근으로 로봇 안전을 사후 보완이 아니라 설계 초기 단계의 사전 학습 문제로 끌어올렸다고 설명한다.
로봇 산업에서는 그동안 고가 장비 파손과 작업자 안전 문제로 인해 고위험 상황 데이터 확보가 가장 큰 병목으로 지적돼 왔다. 실제 현장에서 반복 실험을 수행하기 어렵다 보니, 로봇이 예측하지 못한 충돌에서 취약한 모습을 보이는 경우가 많았다. 비디오투로봇은 넘어지고 부딪히는 상황을 굳이 실물 로봇으로 재현하지 않고도, 실제에 근접한 실패 데이터를 확보할 수 있게 해 이 한계를 완화할 도구로 평가된다.
기술 공개 직후 글로벌 테크 커뮤니티의 반응도 빠르게 나타났다. 에임인텔리전스에 따르면 비디오투로봇 관련 소개 영상은 23일 기준 X와 링크드인 합산 조회수가 20만 회를 넘어섰고, 개발자 플랫폼 깃허브에서도 높은 관심을 받았다. 단순히 새로운 로봇 데모를 보여준 수준을 넘어, 로봇에게 일부러 실패를 가르쳐야 한다는 피지컬 AI 안전 관점이 개발자들 사이에서 공감대를 얻기 시작한 것으로 해석된다.
에임인텔리전스는 그간 텍스트와 오디오, 비디오를 아우르는 멀티모달 AI 안전 연구를 이어왔다. 비디오투로봇은 이런 연구 자산을 물리 세계로 확장한 첫 사례로, 가상 공간에서의 콘텐츠 안전을 넘어 실제 하드웨어와 환경 상호작용까지 시야를 넓힌 시도라는 평가가 나온다. 특히 LG전자, 오픈마인드와의 협력을 통해 로봇 운영체제와 제조사 레벨에서 학습 구조 단계부터 안전성을 설계하는 방향으로 논의가 진행 중인 것으로 알려졌다.
피지컬 AI 안전은 자율주행차, 물류 로봇, 서비스 로봇 등에서 점점 더 중요한 화두로 떠오르는 영역이다. 글로벌 기업들도 충돌 회피 알고리즘과 센서 이중화, 가상 시뮬레이션 강화에 투자하고 있지만, 실제 실패 데이터를 체계적으로 축적해 학습에 반영하는 접근은 아직 초기 단계다. 에임인텔리전스의 시도가 향후 다른 로봇 제조사, 자율주행 분야까지 확산될 수 있을지 주목되는 이유다.
권태윤 에임인텔리전스 연구원은 비디오투로봇을 피지컬 AI 세이프티를 향한 첫걸음이라고 정의했다. 그는 로봇이 실제 환경에서 마주할 다양한 돌발 상황을 선제적으로 학습하도록 하는 피지컬 AI 세이프티 프레임워크를 구축해 나가겠다고 강조했다. 산업계는 이러한 시도가 로봇 안전 설계의 새로운 표준으로 자리잡아 실제 시장에 안착할 수 있을지 지켜보는 분위기다.
