隨著基于大語言模型的 AI 項目從概念驗證階段進入生產(chǎn)階段,企業(yè)對高能效、高安全性和高度可擴展解決方案的需求日益迫切。摩根士丹利最近發(fā)布的一份研究報告預測,在未來幾年,生成式 AI 的電力需求將以每年 75% 的速度激增,其2026 年的能耗或?qū)⑴c西班牙 2022 年的全年能耗相當。1 許多 IBM 客戶表示,支持適當規(guī)模的基礎模型和針對 AI 工作負載的混合架構(gòu)越來越重要。
此次IBM發(fā)布的主要創(chuàng)新技術(shù)包括:
IBM Telum II 處理器:這一全新芯片將搭載于下一代?IBM Z 系列主機,與第一代 Telum 芯片相比,其頻率和內(nèi)存容量均有提升,高速緩存提升40%;集成 AI 加速器內(nèi)核和數(shù)據(jù)處理單元 (DPU) 的性能也得到改善。IBM Telum II處理器將支持大語言模型驅(qū)動的企業(yè)計算解決方案,滿足金融等行業(yè)的復雜交易需求。
IO 加速單元:Telum II 處理器芯片上的全新數(shù)據(jù)處理單元 (DPU) 旨在加速大型主機上用于聯(lián)網(wǎng)和數(shù)據(jù)存儲的復雜 IO 協(xié)議,可簡化系統(tǒng)操作,提高關鍵組件性能。
IBM Spyre加速器:可提供額外的AI計算能力,與 Telum II 處理器相得益彰。Telum II 和 Spyre 芯片共同構(gòu)成了一個可擴展的架構(gòu),可支持AI集成建模方法,即將多個機器學習或深度學習的AI模型與基于編碼器的大語言模型相結(jié)合。通過利用每個模型架構(gòu)的優(yōu)勢,AI集成的方法可以生成比單個模型更準確、更穩(wěn)健的結(jié)果。Spyre 加速器芯片在 Hot Chips 2024 大會期間進行了預覽,并將作為Telum II 處理器的附加選件提供。每個加速器芯片均與IBM 研究院合作開發(fā),通過一個 75 瓦 PCIe 適配器連接。與其他 PCIe 卡一樣,Spyre 加速器可根據(jù)客戶需求進行擴展。
IBM主機和LinuxONE 產(chǎn)品管理副總裁 Tina Tarquinio 表示:”得益于IBM強大的多代并行的開發(fā)路線圖,我們得以在保持技術(shù)領先的同時,滿足企業(yè)不斷升級的 AI 需求。Telum II 處理器和 Spyre 加速器旨在提供安全、節(jié)能、高性能的企業(yè)計算解決方案。這些多年研發(fā)的創(chuàng)新成果將被引入下一代 IBM Z 平臺,幫助客戶大規(guī)模利用大語言模型和生成式 AI技術(shù)。”
Telum II 處理器和 IBM Spyre 加速器將由 IBM的長期合作伙伴三星晶圓代工(Samsung Foundry)生產(chǎn),采用其高性能、高能效的 5 納米工藝節(jié)點。二者將共同支持企業(yè)的先進AI 用例,釋放業(yè)務價值,從而創(chuàng)造新的競爭優(yōu)勢。利用AI集成的方法,客戶可以更快、更準確地獲得預測結(jié)果。適用的生成式 AI用例包括: