자체 강화학습 '스냅PO' 적용
|
업스테이지에 따르면 '솔라 프로 3'는 기존 '솔라 프로 2' 대비 에이전트 성능이 2배 향상됐지만 비용과 처리 속도는 동일하게 유지했다. 매개변수는 1020억 개로 전작 대비 3배 이상 늘었다. 이와 함께 다단계 작업을 수행하는 도구 호출, 복합 지시 이행 등 에이전트 워크플로우 전반에서 성능을 높였다. 에이전트 종합 성능, 코딩, 지시이행 등 주요 벤치마크 평가에서 전작 대비 2배 이상 향상됐다.
업스테이지는 자체 강화학습 기술 '스냅PO'를 적용해 심층 추론 능력을 강화했다. 경시대회급 수학, 대학원 수준 과학 등 고난도 추론 평가에서 높은 성능 향상을 기록했다. 응답 품질도 개선됐다. 일반 사용자 선호도와 한국어 사용자 선호도 등에서 유의미한 개선을 보였다는 설명이다.
업스테이지 관계자는 "대형 모델의 성능을 소형 모델 수준의 비용으로 도입할 수 있어 에이전트 AI 전환을 검토하는 기업과 개발자들의 진입 장벽을 낮출 것으로 기대된다"고 말했다. 솔라 프로 3는 글로벌 AI 모델 서비스 플랫폼 '오픈라우터'와 업스테이지 자체 API를 통해 즉시 이용할 수 있다.
김성훈 업스테이지 대표는 "솔라 프로 3는 실제 업무 환경에서 효과를 낼 수 있는 에이전트 AI 실용성의 도약을 목표로 개발됐다"며 "업계 최고 수준의 기술력을 바탕으로 실제 산업 현장에서 쓰이는 AI 생태계를 확장하겠다"고 말했다.








![[이미지] 솔라 프로 3](https://img.asiatoday.co.kr/file/2026y/03m/24d/2026032401001283200070551.jpg)





