미국 IBM이 자체적으로 설계한 AI반도체(AI 가속기)를 공개하고 이를 자체 메인프레임에 탑재하기로 했다. 양산은 삼성파운드리 5나노 공정에서 맡는다.
IBM은 26일(현지시간) 미국 캘리포니아주 스탠퍼드대에서 열린 반도체 학회 ‘핫 칩스2024’에서 신형 반도체인 ‘텔룸(Telum)’ 2세대 제품과, AI가속기인 스파이어(Spyre)를 공개했다. 두 반도체는 IBM에서 만드는 대형 컴퓨터인 메인프레임에 탑재된다.
IBM이 공개한 텔룸 II 프로세서는 차세대 IBM Z 시스템을 구동하도록 설계된 칩으로 1세대 칩에 비해 캐시가 40% 증가했으며, AI 가속기를 통합하고 데이터 처리 장치(DPU)가 탑재되어있다.
스파이어 AI가속기는 텔룸 II 프로세서를 보완하는 AI 가속기로 추가 옵션으로 선택할 수 있다. 복잡한 AI모델과 생성형AI 추론에 특화되어 있으며, 1테라바이트(TB)까지 메모리 확장이 가능하다. 카드당 전력소모가 75와트 이상을 넘지 않도록 설계됐다.
티나 카르퀴니오 IBM Z 및 리눅스원 담당 부사장은 “텔룸 II 프로세서와 스파이어 액셀러레이터는 고성능, 보안, 전력 효율성이 뛰어난 엔터프라이즈 컴퓨팅 솔루션을 제공하도록 설계되었다”면서 “수년간의 개발 끝에 이러한 혁신이 차세대 IBM Z 플랫폼에 도입되어 고객이 LLM과 제너레이티브 AI를 대규모로 활용할 수 있게 될 것”이라고 자신했다.
텔룸2와 스파이어는 IBM의 메인프레임에만 들어가는 제품으로 엔비디아의 GPU와는 직접 경쟁하지 않는다. 그러나 엔비디아 GPU가 탑재되는 서버와는 경쟁관계에 있다. 특히 IBM 메인프레임은 전세계 금융권에서 주요 인프라로 사용되고 있다.
텔룸2와 스파이어는 이전 텔룸2와 마찬가지로 삼성파운드리 5나노 공정에서 생산된다.
[실리콘밸리=이덕주 특파원]