AI 로봇 더 가볍고 똑똑하게…네이버랩스 유럽 ‘디바인’ 공개

다양한 AI 기능 하나로 처리

	[이미지] 네이버랩스 유럽 디바인	0
네이버랩스 유럽이 '디바인'을 공개했다./네이버

네이버랩스 유럽이 자율주행 로봇의 작업을 한층 수월하게 하는 범용 AI 인코더 '디바인(DIVINE)'을 공개했다.

23일 네이버랩스 유럽은 이미지 이해와 공간 인식, 사람 인식 등 다양한 시각 AI 기능을 하나로 처리할 수 있는 유니버설 인코더 '디바인'을 공개했다고 밝혔다.

인코더는 로봇이 카메라, 라이다(LiDAR) 등 센서를 통해 수집한 데이터를 AI 모델이 처리할 수 있는 형태로 변환하는 장치다. 자율주행 로봇은 이러한 AI 인코더를 여러 개 사용해왔다. 기존에는 위치 추정, 깊이 계산, 공간 이해, 사람 인식 등 작업마다 각각의 AI 모델이 별도의 인코더를 활용해 동일한 입력 데이터를 여러 번 중복 처리해 왔고 이에 따라 메모리 사용량과 연산량이 과도하게 증가하는 한계가 있었다.

디바인은 이때 필요한 여러 인코더들을 하나로 통합한 범용 인코더로, 이미지 이해부터 공간 및 사람 인식까지 다양한 시각 AI 기능을 모두 지원할 수 있다. 네이버랩스 유럽은 이미지와 공간, 사람 인식 등 각 분야에 특화된 AI 모델의 핵심 지식을 하나의 모델에 압축하는 '다중 교사 증류(Multi-Teacher Distillation)' 기술을 적용해 범용 인코더를 구현했다.

이를 통해 로봇은 디바인 하나만으로 다양한 AI 작업을 수행할 수 있게 됐다. 특히 사람과 로봇이 함께 생활하거나 작업하는 환경에서 제한된 컴퓨팅 자원만으로도 주변 상황을 빠르게 인식하고 대응할 수 있다는 설명이다.

	[이미지] 네이버랩스 유럽 디바인(2)	0

실제 실험 환경에서 디바인을 동작시킨 결과, 연산 부담은 줄어드는 반면 성능은 극대화됐다. 여러 개의 인코더를 탑재했을 때 대비 인코더 메모리 사용량은 90%가량 절감됐으며 인코딩의 처리 속도는 최대 12배 향상된 것으로 나타났다. 또한 로봇의 전반적인 메모리 사용량은 약 62% 감소하고, 시스템 처리 속도는 최대 4배까지 향상됐다.

기존의 로봇용 AI모델은 방대한 연산량으로 인해 주로 서버 환경이나 고성능 컴퓨팅 장비에서 구동되어 왔지만, 디바인은 적은 메모리와 연산량으로도 이러한 AI 기능을 실행할 수 있어 온보드 환경에서의 활용성을 높인다. 따라서 더욱 다양한 형태의 로봇에 고성능 AI를 적용할 수 있는 기반이 될 것으로 기대된다.

또한 새로운 AI 기능도 쉽게 추가할 수 있도록 설계돼 AI 모델이 업그레이드될 때마다 해당 모델이 적용된 새로운 로봇을 도입하지 않더라도, 기존 로봇에 탑재된 디바인을 업데이트하면 성능을 손쉽게 끌어올릴 수 있다.

이동환 네이버랩스 비전그룹 리더는 "전세계적으로 피지컬 AI의 상용화를 위해 로봇 두뇌 경량화가 주요 화두로 떠오르고 있다"며 "디바인은 일상 및 산업 현장 전반에 걸쳐 AI 로봇 도입 장벽을 낮추는 데 기여할 것"이라고 말했다.

한편 디바인 관련 연구 2건은 각각 '유럽컴퓨터비전학회(ECCV) 2024'와 '컴퓨터비전 및 패턴 인식 학술대회(CVPR) 2025'에 채택되며 기술력을 인정받았다.