4종 전부 오픈소스 공개
정부 '소버린 AI' 전략 강화 기여
|
16일 NC AI는 한국어 기반의 멀티모달 AI 기술력을 바탕으로 텍스트와 이미지를 동시에 이해할 수 있는 'VARCO-VISION 2.0' 모델군을 오픈소스로 공개했다. 이번에 선보인 모델은 총 4종으로 14B(140억 파라미터) 모델, 1.7B 경량 모델, OCR 특화 모델, 멀티모달 임베딩 모델로 구성됐다. 4종의 모델 중 14B와 임베딩 모델 2종은 이날 공개되며, 1.7B와 OCR모델은 차주 중 공개 예정이다.
특히 주력 모델인 VARCO-VISION 2.0 1.4B는 InternVL3(14B), Ovis2(16B), Qwen2.5-VL(7B) 등 글로벌 최고 수준의 비전언어모델(VLM)을 능가하는 성능을 보였다. 영문·한글 이미지 이해와 OCR 벤치마크 테스트에서 모두 두각을 나타내며 멀티모달 AI에서도 소버린AI의 가능성을 확인했다.
1.7B 모델은 스마트폰이나 PC 등 개인 디바이스에서도 활용할 수 있도록 설계됐으며 OCR 모델은 한국어 환경에 특화된 이미지 내 문자 인식 정확도를 크게 높였다. 특히 AnyRes 해상도 분할 입력 기술을 적용해 다양한 해상도의 이미지도 손실 없이 처리할 수 있다는 설명이다.
|
NC AI는 이들 모델을 금융, 교육, 제조, 콘텐츠, 광고 등 다양한 산업 분야에 적용 가능하다고 설명했다. 복잡한 보고서 자동 요약, 제품 이미지 설명 생성, 자연어 기반 비디오 검색 등 업무 자동화 및 콘텐츠 생성 효율성을 높일 수 있을 것으로 기대된다.
이번 모델들은 모두 연구용 오픈소스로 공개돼 기업과 개인이 자유롭게 활용할 수 있다. NC AI는 이를 통해 전국민 AI 생태계 확대와 정부의 '소버린 AI' 전략 강화에 기여한다는 방침이다.
이연수 NC AI 대표는 "기술 고도화로 글로벌 트렌드가 텍스트만 처리하는 언어모델을 넘어 비전 모델을 함께 활용하는 비전언어모델로 전환되고 있다"며 "이번 4종 모델 공개를 통해 미디어와 게임, 패션 등 버티컬 AI로 기존 국내 멀티모달 AI를 선도하는 NC AI가 비전언어모델에서도 한국의 주권을 지킬 수 있는 가능성을 확인했다"고 밝혔다.
한편 NC AI는 엔씨소프트의 AI 전문 법인으로 게임뿐만 아니라 다양한 산업 영역에서 창작과 비즈니스 혁신을 지원하는 AI 솔루션을 개발 중이다.