Llama 3.1 사전 컴파일 모델 기반 API도 출시 예정
|
레니게이드는 LLM(대규모 언어모델)과 멀티모달 AI 모델의 추론을 효율적으로 처리할 수 있도록 설계된 데이터센터용 차세대 AI 가속기다. 지난해 8월 한 칩스(Hot chips) 2024 컨퍼런스에서 처음 공개돼 글로벌 테크 업계의 관심을 모았다.
이 제품은 △수분 내로 추론용 프로덕션 환경 배포 △수요에 따라 유연하게 추론 인프라 규모 조절 △기존 애저 데이터 및 소프트웨어 스택과 원활한 통합 등 다양한 클라우드 및 온프레미스 환경에 최적화된 기능을 제공한다.
퓨리오사AI는 이번 애저 입점과 함께 Llama 3.1 사전 컴파일 모델 기반 API를 곧 출시할 예정이다. 기업 고객은 이를 통해 레니게이드 기반의 AI 추론 성능을 기존 워크플로우에 통합해 즉시 테스트하고 운용할 수 있다. 향후 다양한 모델 아키텍처 지원도 순차적으로 확대할 계획이다.
제이크 즈보로프스키 마이크로소프트 애저 플랫폼 총괄은 "애저 마켓플레이스는 전 세계 고객이 신뢰할 수 있는 파트너 솔루션을 쉽게 찾고 배포할 수 있는 공간"이라며 "퓨리오사AI의 레니게이드를 이 생태계에 새롭게 맞이하게 되어 기쁘다"고 말했다.
이번 출시를 계기로 퓨리오사AI는 자사 제품 보급에 박차를 가할 계획이다. 현재 국내외 기업 고객을 대상으로 레니게이드 제품평가를 진행 중이며, TSMC와의 협업을 통해 대규모 양산에 돌입했다.
퓨리오사AI 관계자는 "레니게이드의 애저 통합은 누구나 접근 가능한 효율적인 AI 추론 인프라를 제공한다는 당사의 비전을 실현하는 중요한 이정표"라며 "스타트업부터 대기업까지 복잡한 AI 인프라 없이도 필요한 성능을 쉽고 빠르게 확보할 수 있을 것"이라고 밝혔다.
한편 2017년 설립된 퓨리오사AI는 '모두를 위한 지속 가능한 AI 컴퓨팅 환경 구현'을 목표로 AMD, 삼성전자, 퀄컴 출신의 백준호 대표, 김한준 CTO, 구형일 CAO가 공동 창업한 기업이다. 2022년 1세대 NPU 상용화에 성공했고 현재 2세대 NPU 레니게이드를 통해 글로벌 시장 공략에 속도를 내고 있다.