其中,數(shù)據(jù)攝取階段主要看順序?qū)懭胄阅?,?zhǔn)備階段主要看順序讀取性能,訓(xùn)練階段關(guān)注隨機(jī)讀取性能,以及檢查點(diǎn)創(chuàng)建和恢復(fù)所需的讀寫性能,推理階段主要看隨機(jī)讀取能力。

在以上場(chǎng)景中,Solidigm的D5-P5430相較于24TB的SATA HDD的性能有10倍甚至4500倍的差距,是訓(xùn)練過程中的必選方案。

Solidigm的QLC產(chǎn)品技術(shù)非常成熟,它所提供的三大系列QLC產(chǎn)品D5-P5430、D5-P5336、D5-P5316各有特色,適用于不同的應(yīng)用場(chǎng)景。

P5430基于4KB IU,與TLC幾乎可以無縫切換;P5336和P5316則基于較大的數(shù)據(jù)塊,需要一定的操作才能更好地發(fā)揮QLC的優(yōu)勢(shì)。在容量方面,P5336可支持高達(dá)61.44TB,并提供多種接口選擇,而P5316和P5430則支持高達(dá)30.72TB的容量。

具體到AI場(chǎng)景上,如果用戶想要最大化XPU利用率,可以使用SLC的P5810作為緩存,加上CSAL軟件,配合QLC的P5336使用,既能提供大容量又有性能保證。

想要均衡的讀寫性能和成本,則可以選擇P5520和P5430。想要低成本的方案,則可以選擇P5336,它特別適合大塊數(shù)據(jù)的順序讀取和寫入應(yīng)用場(chǎng)景。

金山云原有的數(shù)據(jù)處理方案KS3使用純HDD,加載40TB原始數(shù)據(jù)集需要535分鐘完成一次數(shù)據(jù)準(zhǔn)備。引入Solidigm SSD解決方案后,數(shù)據(jù)準(zhǔn)備時(shí)間縮短至11分鐘,提升了48.6倍。

正??萍紖f(xié)助研究所構(gòu)建大容量數(shù)據(jù)湖,面臨著讀取性能低、部署時(shí)間長(zhǎng)和存儲(chǔ)成本高等挑戰(zhàn)。通過采用SolidigmD5-P5336,正??萍紭?gòu)建了高密度存儲(chǔ)節(jié)點(diǎn),實(shí)現(xiàn)單節(jié)點(diǎn)100萬IOPS和700TB存儲(chǔ)空間,顯著節(jié)省了空間和功耗。

61.44TB大容量企業(yè)級(jí)SSD,國(guó)內(nèi)外用戶接受度有所不同

未來的數(shù)據(jù)量一定還會(huì)持續(xù)增長(zhǎng),隨著用于AI訓(xùn)練的數(shù)據(jù)集以及整體數(shù)據(jù)規(guī)模的不斷增長(zhǎng),對(duì)于大容量存儲(chǔ)的需求也肯定會(huì)越來越高。這也會(huì)讓擁有更大容量,更高密度的SSD更受歡迎。

前不久,戴爾科技發(fā)布了新一代的NAS文件存儲(chǔ)系統(tǒng)PowerScale F910就宣布計(jì)劃采用61TB的QLC SSD,考慮到市場(chǎng)上僅有Solidigm推出了61TB的QLC SSD,極有可能就是用的這款Solidigm D5-P5336。

一些主流存儲(chǔ)廠商也開始支持超大容量SSD,似乎預(yù)示著大容量磁盤更容易被普遍接受了。然而,倪錦峰介紹稱,目前國(guó)外用戶比較青睞61.44TB這種容量的企業(yè)級(jí)SSD,而國(guó)內(nèi)企業(yè)用戶則傾向于選擇其它容量如30TB的盤。

由于某些區(qū)域或時(shí)間段內(nèi),一些國(guó)外企業(yè)無法獲得足夠的電力預(yù)算,所以,只能選擇功耗更低的QLC SSD。同時(shí),傳統(tǒng)機(jī)房功率有限,難以支持高功耗的GPU系統(tǒng),但由于機(jī)房改造成本太高,用SSD替代HDD來降低功耗反而是更經(jīng)濟(jì)的選擇。

此外,HDD的年化失效率較高,容量帶來更多故障風(fēng)險(xiǎn),需要更多失效管理,數(shù)據(jù)恢復(fù)成本高。因此,從運(yùn)營(yíng)角度看,使用SSD替換HDD也可以節(jié)省大量成本。因此,很多國(guó)外企業(yè)選擇更大容量的SSD。

與國(guó)外一些地區(qū)的用戶不同的是,國(guó)內(nèi)企業(yè)用戶在當(dāng)前階段更側(cè)重于GPU的投資。由于GPU在AI計(jì)算中的重要性,國(guó)內(nèi)企業(yè)在這方面投入了大量資源,對(duì)存儲(chǔ)的關(guān)注還有待提高。

而且,國(guó)內(nèi)企業(yè)對(duì)功耗和空間的要求相對(duì)沒有國(guó)外那么高。在國(guó)內(nèi)的數(shù)據(jù)中心環(huán)境中,功耗和空間雖然也是考慮因素,但相對(duì)來說沒有那么緊迫。

國(guó)內(nèi)在AI存儲(chǔ)架構(gòu)和配置方面還在不斷完善過程中。國(guó)內(nèi)客戶正在逐步接受并研究大容量SSD的部署,這也需要生態(tài)系統(tǒng)的準(zhǔn)備。硬軟件生態(tài)系統(tǒng)還需要針對(duì)大容量SSD做相應(yīng)地調(diào)整和優(yōu)化。

倪錦峰也表示,非常希望看到越來越多的國(guó)內(nèi)客戶采用大容量SSD,以進(jìn)一步推動(dòng)AI等技術(shù)的發(fā)展。

分享到

zhupb

相關(guān)推薦