|
이번 행사에서 인텔 사친 카티 최고기술책임자(CTO)는 "AI는 정적 학습에서 에이전트형 AI가 주도하는 실시간·전역 추론으로 전환되고 있다"며 "이러한 복잡한 워크로드를 확장하려면 적절한 실리콘을 적절한 작업에 매칭하는 이종 시스템이 필요하다"고 설명했다. 이어 "인텔의 Xe 아키텍처 데이터센터 GPU는 토큰 처리량이 급증함에 따라 고객이 필요로 하는 효율적인 헤드룸 성능과 더 큰 가치를 제공할 것"이라고 밝혔다.
인텔은 추론이 AI 워크로드의 핵심으로 자리 잡으면서 강력한 칩 성능을 넘어 시스템 차원의 최적화와 소프트웨어 통합이 경쟁력을 좌우하는 요인으로 부상했다고 내다봤다. 인텔은 하드웨어부터 오케스트레이션 전반에 걸친 개방형·워크로드 중심 아키텍처를 구축해 배포와 확장이 용이한 AI 시스템을 구현하고 있다.
새로운 데이터센터용 GPU는 공랭식 엔터프라이즈 서버에 맞춰 전력 및 비용 최적화를 이뤘으며, 추론용 워크플로우에 최적화된 대용량 메모리 및 대역폭을 제공하도록 설계됐다. 주요 사양은 △와트당 성능(PPW)을 극대화한 Xe3P 마이크로아키텍처 △160GB LPDDR5X 메모리 △'서비스형 토큰' 공급업체 및 추론 서비스 환경에 적합한 데이터 유형 지원 등이다.
한편 인텔은 이기종 AI 시스템을 위한 개방형 통합 소프트웨어 스택을 아크 프로 B 시리즈 GPU에서 개발·테스트를 진행하고 있다. 크레센트 아일랜드 GPU의 고객 샘플링은 오는 2026년 하반기부터 제공된다.