在下午分論壇“大模型存儲(chǔ)分論壇”上,西安紫光國芯半導(dǎo)體股份有限公司發(fā)表了《用CXL設(shè)備實(shí)現(xiàn)服務(wù)器內(nèi)存的容量及帶寬擴(kuò)展》的演講。
以下內(nèi)容根據(jù)速記整理,未經(jīng)本人審定:
紫光國芯:大家好,今天我分享的題目是用CXL設(shè)備實(shí)現(xiàn)服務(wù)器內(nèi)存的容量和帶寬擴(kuò)展。
首先,給大家介紹一下西安紫光國芯半導(dǎo)體股份有限公司。
紫光國芯的前身是2004年德國英飛凌成立的西安研發(fā)中心存儲(chǔ)器事業(yè)部,到如今已有近20年的歷史,我們是一家以存儲(chǔ)技術(shù)為核心的產(chǎn)品和服務(wù)提供商。早在2019年隨著CXL技術(shù)的正式發(fā)布,紫光國芯就開始緊密關(guān)注這一技術(shù)的發(fā)展,并于2020年加入了CXL技術(shù)聯(lián)盟成為contributor級(jí)會(huì)員,深度參與相關(guān)標(biāo)準(zhǔn)制定的技術(shù)討論,并一直積極參與相關(guān)技術(shù)的探索與布局產(chǎn)品落地。2022年紫光國芯發(fā)布了CXL產(chǎn)品路線圖,并于2023年開始自研CXL相關(guān)產(chǎn)品的客戶送樣工作。
CXL技術(shù)基本概念
CXL即Compute Express Link,是一種開放式高速互連技術(shù)標(biāo)準(zhǔn),旨在實(shí)現(xiàn)計(jì)算和存儲(chǔ)系統(tǒng)的高效數(shù)據(jù)訪問,特別是為了解決計(jì)算和存儲(chǔ)之間的“存儲(chǔ)墻”問題。
CXL的技術(shù)聯(lián)盟成立于2019年3月,全球頭部的CPU廠家與服務(wù)器廠家都參與其中,聯(lián)盟2019年3月份成立時(shí)發(fā)布了CXL1.0協(xié)議標(biāo)準(zhǔn)。半年時(shí)間后發(fā)布了CXL1.1協(xié)議標(biāo)準(zhǔn),后續(xù)首批落地的產(chǎn)品都是基于CXL1.1的標(biāo)準(zhǔn)。
2020年10月,聯(lián)盟發(fā)布了CXL2.0協(xié)議標(biāo)準(zhǔn)。2.0協(xié)議最大的特點(diǎn)是可以實(shí)現(xiàn)內(nèi)存的池化,支持多個(gè)主機(jī)和存儲(chǔ)器設(shè)備之間的互聯(lián),實(shí)現(xiàn)帶寬和容量的有效擴(kuò)展。
2022年8月,聯(lián)盟發(fā)布了CXL3.0協(xié)議標(biāo)準(zhǔn),增加了fabric的概念,支持多個(gè)Switch之間更高維度的互聯(lián),可以應(yīng)用到更高的體系架構(gòu)中,實(shí)現(xiàn)進(jìn)一步內(nèi)存和帶寬的擴(kuò)展。
到目前為止,CXL技術(shù)聯(lián)盟擁有超過200多家成員, CPU廠家、服務(wù)器廠家、存儲(chǔ)器廠家陸續(xù)加入,整個(gè)生態(tài)在飛速發(fā)展階段,各種各樣的產(chǎn)品已經(jīng)落地應(yīng)用。
CXL相關(guān)產(chǎn)業(yè)生態(tài)
以英特爾和AMD兩個(gè)CPU廠家為例來介紹一下CXL的生態(tài)。
2023年初,英特爾發(fā)布了支持CXL1.1協(xié)議的SPR CPU,接著又發(fā)布了另外一款基于CXL1.1協(xié)議的EMR CPU。今年三季度,英特爾發(fā)布了兩款支持CXL2.0協(xié)議的CPU, Granite和Sierra Forest,CXL通道數(shù)從SPR和EMR的32個(gè)增加到64個(gè)。
AMD也是2023年發(fā)布了支持CXL1.1協(xié)議的Genoa CPU,今年二季度發(fā)布了支持CXL2.0協(xié)議的Turin CPU。
同時(shí)國內(nèi)越來越多的CPU廠家、服務(wù)器廠商也在布局CXL技術(shù),推動(dòng)應(yīng)用加速落地,尤其是CXL TYPE3領(lǐng)域。
基于CXL技術(shù)的典型應(yīng)用場景
基于CXL技術(shù)的典型應(yīng)用場景整體有TYPE1、TYPE2和TYPE3三種。在詳細(xì)介紹三種應(yīng)用之前,先了解一下CXL協(xié)議本身。
CXL本身是一個(gè)開放互連的協(xié)議,從內(nèi)部子協(xié)議來看支持CXL.io、CXL.cache和CXL.memory,CXL.io跟PCIe協(xié)議非常類似,其實(shí)CXL本身采用了PCIe的物理層,比如CXL2.0和PCIe Gen5的物理層相同,CXL3.0跟PCIe Gen6的物理層也一樣。從協(xié)議的角度,支持.io,主要是實(shí)現(xiàn)計(jì)算機(jī)的配置,.Cache可以實(shí)現(xiàn)Cache類型的memory的訪問,.memory可以實(shí)現(xiàn)memory類型存儲(chǔ)設(shè)備訪問。
基于三種子協(xié)議可以組合出來各種各樣的應(yīng)用場景,比如TYPE1支持CXL.io和CXL.cache,這樣就可以應(yīng)用在一些Cache類型的設(shè)備上,比如智能網(wǎng)卡。
TYPE2類型支持CXL.io、CXL.cache、CXL.memory三種協(xié)議,可以應(yīng)用在GPU、PGI的加速卡等。
TYPE3類型支持CXL.io和CXL.memory,實(shí)現(xiàn)memory內(nèi)存和容量的擴(kuò)展。
從業(yè)界已經(jīng)落地的產(chǎn)品來看,TYPE3類型最多,重點(diǎn)是要解決存儲(chǔ)的帶寬和容量的問題。
TYPE3類型在系統(tǒng)中如何應(yīng)用?對(duì)于傳統(tǒng)的系統(tǒng)來說,一個(gè)服務(wù)器里面有CPU,有DRAM的內(nèi)存模組,相當(dāng)于是一個(gè)CPU可以訪問自己獨(dú)立的內(nèi)存模組,但是整個(gè)存儲(chǔ)容量和帶寬是有限制的,內(nèi)存負(fù)載也不能更好的分配。當(dāng)服務(wù)器的負(fù)載高的時(shí)候可能內(nèi)存不夠,低的時(shí)候空閑內(nèi)存又是浪費(fèi),一個(gè)CPU對(duì)于配套內(nèi)存的獨(dú)立訪問,不能實(shí)現(xiàn)內(nèi)存共享。
基于這個(gè)問題,紫光國芯采用CXL TYPE3的設(shè)備,首先可以插在panel上實(shí)現(xiàn)內(nèi)存的擴(kuò)展。另外一個(gè)很大的優(yōu)勢(shì),比如以CXL2.0和3.0的設(shè)備實(shí)現(xiàn)內(nèi)存的池化或者fabric,這樣可以多個(gè)CPU共享內(nèi)存,有的內(nèi)存負(fù)載輕,有的內(nèi)存負(fù)載高,通過CXL協(xié)議來實(shí)現(xiàn)均衡,提升系統(tǒng)內(nèi)存的利用率,降低TCO。
從整體實(shí)現(xiàn)的成果來看,通過CXL的memory TYPE3設(shè)備可以在原來基礎(chǔ)上實(shí)現(xiàn)整個(gè)系統(tǒng)內(nèi)存帶寬和容量非常好的擴(kuò)展。
紫光國芯的CXL布局
紫光國芯在CXL技術(shù)方面有著全面的布局。2019年這項(xiàng)技術(shù)發(fā)布,紫光國芯一直緊密關(guān)注CXL技術(shù)演進(jìn)和產(chǎn)業(yè)生態(tài)的發(fā)展,積極布局相關(guān)產(chǎn)品,并于2021年啟動(dòng)了CXL相關(guān)產(chǎn)品的研發(fā)工作。2022年公司正式發(fā)布了CXL產(chǎn)品路線圖,2023年,完成了CXL相關(guān)產(chǎn)品樣品的客戶送樣。今年,我們的CXL產(chǎn)品已在客戶端實(shí)現(xiàn)成功導(dǎo)入,未來還會(huì)發(fā)布更多CXL相關(guān)的產(chǎn)品。
紫光國芯當(dāng)前的CXL產(chǎn)品主要針對(duì)內(nèi)存擴(kuò)展方案,提供主控芯片或模組部件方案。介質(zhì)可以支持非易失性內(nèi)存(PCM)介質(zhì)和DRAM介質(zhì)。
支持PCM介質(zhì)的是SCM設(shè)備,可支持128GB到2TB的存儲(chǔ)容量,基于CXL2.0的協(xié)議標(biāo)準(zhǔn),支持PCIe Gen5 X8/X4的物理層,對(duì)外接口帶寬與PCIe Gen5速率一樣。目前正在送樣,預(yù)計(jì)明年Q3量產(chǎn)。
支持DRAM介質(zhì)的產(chǎn)品控制器芯片可支持64GB到2TB的存儲(chǔ)容量,也是基于CXL2.0的協(xié)議,支持PCIe Gen X16/X8/X4的接口形態(tài),目前也在送樣階段,預(yù)計(jì)明年年底量產(chǎn)。
目前,紫光國芯積極布局下一代產(chǎn)品,已經(jīng)規(guī)劃基于CXL3.x協(xié)議的控制器芯片,對(duì)應(yīng)的物理層接口是PCIe Gen6,進(jìn)一步提升性能。
今天峰會(huì)上,紫光國芯還設(shè)有專門的CXL產(chǎn)品的展示區(qū),歡迎大家到展臺(tái)參觀交流。
以上便是紫光國芯關(guān)于用CXL設(shè)備實(shí)現(xiàn)服務(wù)器內(nèi)存的容量及帶寬擴(kuò)展的分享,感謝大家的關(guān)注和支持!