中國計算機學(xué)會存儲專委會主任委員、廈門大學(xué)信息學(xué)院院長、清華大學(xué)舒繼武教授在2021全球閃存峰會上發(fā)表主題演講

現(xiàn)在進入萬物互聯(lián)的時代,產(chǎn)生很多的設(shè)備,像電子商務(wù)、智能終端、智能駕駛、社交網(wǎng)絡(luò)等,這些智能應(yīng)用的數(shù)據(jù)處理帶來極大挑戰(zhàn)——I/O訪存不規(guī)則,數(shù)據(jù)規(guī)模越來越大,智能應(yīng)用的模型規(guī)模龐大,高吞吐率實時更新,還有計算量要求很大,能耗比較低等。

我們面臨的是一場云邊挑戰(zhàn)。所謂的邊是所有產(chǎn)生數(shù)據(jù)的地方,大部分指產(chǎn)生和匯集數(shù)據(jù)的終端。邊緣云、中心云等都可以稱之為云。尤其是邊端存在計算受限,存儲受限,功耗受限,存儲受限,通信受限。對云的要求是實時性、數(shù)據(jù)安全性及可靠性等。

而傳統(tǒng)計算架構(gòu)無法適應(yīng)智能應(yīng)用,會出現(xiàn)通信回路、可擴展性、計算效率等問題。

解決問題一般有兩個思路:一個是怎么讓云離邊更近。在邊上做多個邊緣云,相對來說邊緣的計算和存儲能力就變得更快更強大,距離上也不一定傳輸?shù)街行脑苹虮镜卦?,但由于功耗的要求,很難滿足這種模式;

第二種思路是讓邊變得更強,讓邊緣的計算能力更強、通信更短、存儲更快更大、功耗更低,我們經(jīng)過嘗試是可行的。

這里主要用了兩種技術(shù):1.近數(shù)據(jù)計算,2.感存算融合。

近數(shù)據(jù)計算不是一個很新的概念,特別是傳統(tǒng)計算和存儲分離的模式,越來越對運行現(xiàn)有應(yīng)用感到吃力。

一些新器件(如RRAM)的誕生雖然能真正做到存儲和計算的融合。但這種器件的形成還在發(fā)展中,要真正落地可能還要相當(dāng)長的時間。

現(xiàn)在還有一種近存計算思路——把存儲和計算距離拉近,傳輸路徑變短,計算性能也就有所提升。

近數(shù)據(jù)智能存算融合系統(tǒng)

近數(shù)據(jù)智能存算融合系統(tǒng)現(xiàn)在也有近似的架構(gòu),像三星的SmartSSD,還有阿里的可計算存儲系統(tǒng),這種計算僅僅是對計算做加速,也就是現(xiàn)在各種GPU、XPU、TPU等。

但整個回路的I/O路徑搬移沒有太大變化,所以它只能支持存儲軟件的計算,如加密、視頻,處理器等應(yīng)用,不能支持通用智能應(yīng)用,應(yīng)用范圍受限。

清華大學(xué)研發(fā)的近數(shù)據(jù)智能存算融合系統(tǒng)TH-iSSD,在性能參數(shù)方面,容量達到1TP,帶寬從2GB可擴展至10GB,待機功耗低于5w,平均功耗低于50w,(約48w)能效比相對PowerPC提升了20倍以上,支持任意智能應(yīng)用部署。

簡要介紹一下清華TH-iSSD的思路原理。

感存算的過程——感知數(shù)據(jù),然后存儲數(shù)據(jù)之后提取進行計算。整個過程的I/O路徑很長,延遲很高。

我們的思路是把它的感知接口和智能計算、存儲控制器做在一個FPGA上,真正做到存算融合。這存在很多挑戰(zhàn),我們下一步是做一個ASIC芯片的定制,主要借助SoC的架構(gòu),利用RISC-V來提供輕量的CPU內(nèi)核,之后用RoCC的可擴展接口,對計算和存儲做融合,采用55nm制程達到帶寬20GB的指標(biāo),能支持?jǐn)U展性應(yīng)用,性能達到10Tflops。

云邊協(xié)同的智能感存算融合案例

以航天衛(wèi)星,航空系統(tǒng),氣象預(yù)測為例:

1.衛(wèi)星系統(tǒng)。面向航天衛(wèi)星,基于高分辨率光學(xué)衛(wèi)星圖像的智能計算系統(tǒng)需要進行遠程的數(shù)據(jù)傳輸,對計算峰值有要求;需要高帶寬進行實時存儲和傳輸,實時處理的高算力;數(shù)據(jù)流與計算流復(fù)雜,性能和可靠性低;SSD出現(xiàn)性能抖動,帶寬和延遲不穩(wěn)定。

對此我們重寫了控制器。延遲不可控,那就重寫控制器,和計算結(jié)合在一起,讓延遲變得可控。去除存儲硬件模塊冗余,如存儲管理處理器冗余,SSD控制器冗余以及計算存儲模式(先存儲再計算)帶來的數(shù)據(jù)流冗余,真正做到感存算一體。

2.航空系統(tǒng)。廈門大學(xué)航空院研發(fā)的“海騎兵”無人機,主要做海上搜救、殘骸搜索和巡檢。最初海騎兵不能使用高清相機,飛行速度不能過快,以免數(shù)據(jù)來不及存儲。

我們的解決方法是利用感存算融合縮短數(shù)據(jù)流程,從算法的角度來說去除冗余數(shù)據(jù)存儲,使存儲容量提升100倍,帶寬提高40倍,延遲降低10倍,原來1秒鐘僅能處理1/4張照片,現(xiàn)在1秒鐘能處理25張照片,提高100倍。

3. 天氣預(yù)報。 因為云邊端數(shù)據(jù)在不停變化,是一個增量,我們在云邊端芯片里面集成了在線增量學(xué)習(xí)的算法,做更好的預(yù)測,使得天氣預(yù)報從小時級變到分鐘級。

為此我們做了兩款設(shè)備:近數(shù)據(jù)存儲融合系統(tǒng)TH-SmallEdge,存儲容量256GB,存儲帶寬200MB/s,2枚5號電池可以持續(xù)工作一個月。如果借助一些可再生能源,可以支持將近一年。

后來我們做了更小的TH-TinyEdge,容量為64GB,但2枚5號電池能持續(xù)工作一年,但沒有推測和預(yù)測的功能。 目前系統(tǒng)已部署在海南省三沙市及附屬島礁氣象預(yù)報。

研發(fā)這三款設(shè)備,我們最大的思想是用三個關(guān)鍵詞:近數(shù)據(jù)、智能、感存算融合,這里的融合是真正把存儲控制器和計算控制放到一起。

(以上基于2021年全球閃存峰會演講整理,未經(jīng)過本人審閱)

分享到

崔歡歡

相關(guān)推薦