logo
“AI가 스스로 임무 만든다”…UNIST, 피지컬 AI 적응력 진화
IT/바이오

“AI가 스스로 임무 만든다”…UNIST, 피지컬 AI 적응력 진화

한채린 기자
입력

AI가 스스로 가상의 임무를 만들어 예습하는 ‘메타 강화학습’ 기법이 국내 연구진에 의해 개발됐다. 피지컬 AI가 새로운 환경에 미리 노출되지 않아도 적응할 수 있도록 한 이 획기적 방법은 기존 한계를 돌파하며 로봇 및 자율주행 분야의 기술 진보를 선도하고 있다. 업계는 이번 기법 출현을 ‘AI 적응성 경쟁의 전환점’으로 평가하며 글로벌 표준 도약 가능성을 주시하고 있다.

 

울산과학기술원(UNIST) 인공지능대학원 한승열 교수팀은 19일, AI가 학습하지 않은 임무에도 유연하게 대처할 수 있도록 스스로 임무를 만들어 예습하는 ‘TAVT(Task-Aware Virtual Training)’ 기법을 공개했다. 팀은 딥러닝 기반 표현 학습과 임무 생성 모듈 조합으로 임무(태스크) 구조의 핵심 특성을 파악한 뒤, 이를 바탕으로 가상의 임무를 생성해 AI가 사전 학습할 수 있도록 설계했다. 표현 모듈이 임무 간 유사도를 뽑아 잠재 임무 구조(latent representation)를 구성하면, 생성 모듈이 이를 조합해 실제 해본 적 없는 임무를 제시하는 방식이다. 이 과정에서 생성 임무는 기 배운 임무의 특성을 보존하면서도, 현실 세계에서 마주칠 수 있는 다양한 상황을 예습하는 효과를 준다.

연구진은 치타, 개미, 2족 보행 등 다양한 로봇 시뮬레이션에 TAVT를 적용한 결과, 기존 메타강화학습보다 훈련하지 않은 임무(미적응 상황)에서 빠르고 안정적으로 적응하는 모습을 확인했다. 특히 치타 로봇의 경우 목표 속도를 미리 경험하지 않아도 TAVT 기법 적용 시 중간 속도 영역(1.25, 1.75 m/s 등)에서 신속하게 속도 파악과 주행 제어를 수행했다. 기존 방식은 새로운 임무에서 적응이 느리거나 아예 멈추는 일이 많았다. 한승열 교수는 “AI 에이전트의 임무 일반화 능력을 높이는 새 접근법으로 자율주행, 드론 등 다양한 실제 응용 분야에서 큰 효과를 기대할 수 있다”고 설명했다.

 

전 세계적으로 AI의 복합 상황 적응력은 로봇, 물류, 모빌리티 등 핵심 미래산업 경쟁력의 관건이 되고 있다. 구글, 딥마인드 등도 ‘임무 예측형’ 메타 강화학습 연구에 투자 중이지만, 한국 연구진이 임무를 스스로 만들어 예습까지 연결한 방식은 드물다. 전문가들은 TAVT와 같은 플랫폼이 글로벌 시장 표준화 경쟁에서도 의미 있는 성과가 될 수 있다고 보고 있다.

 

기술 상용화를 위해서는 실제 환경 데이터와 시뮬레이션 연동, AI 윤리 및 안전 규제 등 해결 과제도 남아 있다. ICML 선정 등 국제적 연구성을 인정받은 만큼, 정책 차원의 지원과 제도 정비가 뒤따라야 산업 적용이 가속될 전망이다.

 

산업계는 “AI가 예측 불가능한 상황을 실시간 학습하고 대처할 수 있다면 자율주행 등 차세대 플랫폼 주도권에도 변화가 일 것”으로 보고 있다. 기술과 안전, 규제와 산업 기반이 균형 있게 발전해야 지속 성장의 조건이 마련된다는 평가가 나온다.

한채린 기자
share-band
밴드
URL복사
#unist#tavt#icml