융합 핵심기술 분야 발전 방향 모색
|
한국전자통신연구원(ETRI)는 설계 경진대회에서 신규 개발한 AI 반도체 플랫폼 기술을 소개했다고 17일 밝혔다.
이날 소개된 '모듈형 엣지 AI 반도체 플랫폼 기술'은 RISC-V 기반 개방형 아키텍처와 자체 개발된 MLIR 기반 컴파일러 기술을 결합한 하드웨어와 소프트웨어의 통합설계 기술이다. 이는 기존 상용 기술 대비 접근성과 확장성이 탁월한 오픈소스 기반 설계 방식이다.
이번 워크숍에서는 AI 반도체 소프트웨어 플랫폼과 관련된 최신 기술 동향과 연구 성과가 공유됐다.
'Beyond Silicon: NPU를 위한 소프트웨어 생태계' 발표에서는 AI 반도체가 실제 산업에 적용되기 위해서 소프트웨어 생태계, 특히 오픈소스 기반의 개발 환경이 중요하다는 점이 강조됐다.
국산 신경망처리장치(NPU)를 위한 오픈소스 기반 대규모 언어모델(LLM) 서빙 라이브러리 개발 사례도 함께 소개됐다.
이어 '이기종 시스템에서의 DNN 스케줄링 최적화' 발표에서는 CPU, GPU 등 다양한 연산 장치가 혼합된 시스템에서 딥러닝 모델의 실행 속도를 높이기 위한 스케줄링 기법이 발표됐다.
리벨리온의 'PyTorch 기술 개발 방향' 발표에서는 PyTorch 프레임워크를 기반으로 한 그래프 모드 및 즉시 실행 모드(eager mode) 개발 현황과, AI 연산 최적화를 위한 Triton 커널 작성 기술, 고속 LLM 실행을 위한 vLLM 지원 기술 등이 소개됐다.
마지막으로 '경량화된 대규모 언어모델(LLM)의 성능 평가' 발표에서는 최신 거대 언어모델에 경량화 기법을 적용한 사례와 함께, 성능 저하 원인 및 실무 적용 시 고려사항이 설명됐다.
정영준 ETRI 온디바이스AI연구본부장은 "해외 상용 기술에 의존하던 핵심 기술 영역을 국산화함으로써 기술 수입 의존 구조를 개선하고 중소 기업의 시장 진입 기회를 확대시켜, AI 반도체 생태계와 고급 인력 양성의 기반이 되기를 기대한다"고 말했다.