닫기

NC AI, 멀티모달 AI 모델 ‘VARCO-VISION 2.0’ 공개…글로벌 최고 성능

기사듣기 기사듣기중지

공유하기

닫기

  • 카카오톡

  • 페이스북

  • 트위터 엑스

URL 복사

https://www.asiatoday.co.kr/kn/view.php?key=20250716010009025

글자크기

닫기

김영진 기자

승인 : 2025. 07. 16. 09:12

14B 모델 글로벌 최고 수준 성능 입증
4종 전부 오픈소스 공개
정부 '소버린 AI' 전략 강화 기여
nc
NC AI가 'VARCO-VISION 2.0' 4종을 공개했다./NC AI
NC AI가 멀티모달 AI(인공지능) 모델 'VARCO-VISION 2.0(바르코-비전 2.0)' 4종을 공개하며 비전·언어 모델 분야에서 글로벌 경쟁력을 입증했다.

16일 NC AI는 한국어 기반의 멀티모달 AI 기술력을 바탕으로 텍스트와 이미지를 동시에 이해할 수 있는 'VARCO-VISION 2.0' 모델군을 오픈소스로 공개했다. 이번에 선보인 모델은 총 4종으로 14B(140억 파라미터) 모델, 1.7B 경량 모델, OCR 특화 모델, 멀티모달 임베딩 모델로 구성됐다. 4종의 모델 중 14B와 임베딩 모델 2종은 이날 공개되며, 1.7B와 OCR모델은 차주 중 공개 예정이다.

특히 주력 모델인 VARCO-VISION 2.0 1.4B는 InternVL3(14B), Ovis2(16B), Qwen2.5-VL(7B) 등 글로벌 최고 수준의 비전언어모델(VLM)을 능가하는 성능을 보였다. 영문·한글 이미지 이해와 OCR 벤치마크 테스트에서 모두 두각을 나타내며 멀티모달 AI에서도 소버린AI의 가능성을 확인했다.

1.7B 모델은 스마트폰이나 PC 등 개인 디바이스에서도 활용할 수 있도록 설계됐으며 OCR 모델은 한국어 환경에 특화된 이미지 내 문자 인식 정확도를 크게 높였다. 특히 AnyRes 해상도 분할 입력 기술을 적용해 다양한 해상도의 이미지도 손실 없이 처리할 수 있다는 설명이다.

ncai
새 모델 벤치마크 결과./NC AI
텍스트·이미지·비디오 간 의미를 고차원 임베딩으로 연결하는 임베딩 모델도 공개됐다. 해당 모델은 영상 검색 벤치마크(MultiVENT2.0)에서 제로샷 기준 최고 성능을 기록했으며, 기존 고성능 이미지-텍스트 검색 모델의 벡터를 비디오-텍스트 모델에 적용해 추가 학습 없이 성능을 높인 것이 특징이다.

NC AI는 이들 모델을 금융, 교육, 제조, 콘텐츠, 광고 등 다양한 산업 분야에 적용 가능하다고 설명했다. 복잡한 보고서 자동 요약, 제품 이미지 설명 생성, 자연어 기반 비디오 검색 등 업무 자동화 및 콘텐츠 생성 효율성을 높일 수 있을 것으로 기대된다.

이번 모델들은 모두 연구용 오픈소스로 공개돼 기업과 개인이 자유롭게 활용할 수 있다. NC AI는 이를 통해 전국민 AI 생태계 확대와 정부의 '소버린 AI' 전략 강화에 기여한다는 방침이다.

이연수 NC AI 대표는 "기술 고도화로 글로벌 트렌드가 텍스트만 처리하는 언어모델을 넘어 비전 모델을 함께 활용하는 비전언어모델로 전환되고 있다"며 "이번 4종 모델 공개를 통해 미디어와 게임, 패션 등 버티컬 AI로 기존 국내 멀티모달 AI를 선도하는 NC AI가 비전언어모델에서도 한국의 주권을 지킬 수 있는 가능성을 확인했다"고 밝혔다.

한편 NC AI는 엔씨소프트의 AI 전문 법인으로 게임뿐만 아니라 다양한 산업 영역에서 창작과 비즈니스 혁신을 지원하는 AI 솔루션을 개발 중이다.

김영진 기자

ⓒ 아시아투데이, 무단전재 및 재배포 금지

기사제보 후원하기