|
이는 CVPR의 세부 프로그램인 'Embodied AI 워크숍' 내에서 개최된 국제 로봇 조작 대회다. AI 에이전트가 실제 환경과 상호작용하며 복잡한 작업을 수행하는 능력을 겨루는 자리다. 김 교수 연구팀은 지난해 같은 대회에서 3위를 기록한 데 이어, 올해는 최종 1위를 차지했다.
연구팀은 김희원 교수와 이상민·박성용 학생(미디어학과 석사과정)으로 구성됐다. 챌린지에는 김도원 학생(글로벌미디어학부 4학년)과 임채우 학생(메타버스·문화콘텐츠학과 석사과정)이 참여했다. 발표 논문의 제목은 'DynScene: Scalable Generation of Dynamic Robotic Manipulation Scenes for Embodied AI'다.
'DynScene'은 정적인 장면 구성 데이터와 로봇 동작 데이터를 분리해 생성하던 기존 방식에서 벗어나, 두 요소를 동시에 생성함으로써 데이터의 다양성과 현실감을 획기적으로 높인 것이 특징이다.
김희원 교수는 "이 기술은 기초 모델과 생성 모델을 활용해 적은 양의 학습 데이터만으로도 로봇 조작을 정교하게 구현할 수 있다는 점에서 의미가 크다"며 "AI 기반 로봇 기술에 대한 진입장벽을 낮춰, 대규모 데이터 확보가 어려운 기업들에게도 실질적인 도움이 될 것"이라고 말했다.
그러면서 "이번 논문은 숭실대학교 학생들이 주저자로 참여해 CVPR 본 학회에서 직접 발표한 첫 사례라는 점에서도 더욱 뜻깊다"며 "학생들과 함께 세계 무대에서 경쟁력 있는 연구를 이어가겠다"고 덧붙였다.