極致性能,提高AI訓(xùn)練效率
Huawei OceanDisk EX 560主打極致性能,隨機(jī)寫性能非常強(qiáng)悍,不僅隨機(jī)寫時(shí)延低于7μs,而且最高可達(dá)1500K IOPS,這一性能參數(shù)超過了基于PCIe 6.0企業(yè)級(jí)SSD的產(chǎn)品,后者僅為900 KIOPS。
考慮到這樣的性能,還有60 DWPD的耐久性,可以確定是一款SLC的盤。此外,這塊硬盤的容量規(guī)格有1.6TB、3.2TB以及6.4TB三個(gè)版本可選。
4K隨機(jī)讀寫性能對(duì)于AI訓(xùn)練前的數(shù)據(jù)加載,還有訓(xùn)練過程中的小文件訪問中尤其重要,能顯著減少GPU等待數(shù)據(jù)加載的情況,讓昂貴的計(jì)算資源利用率更高。
華為公開的資料顯示,該硬盤適用于AI一體機(jī)訓(xùn)練場景,它能將單機(jī)可微調(diào)的模型參數(shù)擴(kuò)大6倍,可以對(duì)千億參數(shù)大模型進(jìn)行微調(diào)。
高性能提高AI推理效率
Huawei OceanDisk SP 560也是一款高性能的盤,隨機(jī)寫性能最高可達(dá)600K IOPS,隨機(jī)寫時(shí)延低于7μs,耐久性1 DWPD。
華為公開資料顯示,該硬盤適用于一體機(jī)和集群的推理場景,可推理序列長度提升2.5倍,進(jìn)一步優(yōu)化推理體驗(yàn)和成本,實(shí)現(xiàn)TPS提升1~2倍,首Token時(shí)延降低75%。
為什么高性能SSD能提高AI推理序列長度呢?這是因?yàn)楫?dāng)SSD速度足夠快,推理系統(tǒng)就可以把顯存當(dāng)中不活躍的KV數(shù)據(jù)下沉到SSD里。
以前因?yàn)镾SD存儲(chǔ)比較慢,所以只能在顯存里跑較短的序列?,F(xiàn)在當(dāng)SSD足夠快的時(shí)候,序列變得更長的時(shí)候也不會(huì)導(dǎo)致較長的等待時(shí)間,不影響用戶體驗(yàn),所以長度上限提升。
超大容量SSD,提高數(shù)據(jù)預(yù)處理效率
Huawei OceanDisk LC 560是一款超大容量的盤,最大單盤物理容量245TB,與市面上已有最大容量SSD持平,更大的容量意味著可以減少硬盤數(shù)量和存儲(chǔ)集群復(fù)雜度。
該硬盤的讀帶寬可達(dá)14.7GB/s,適用于集群訓(xùn)練場景,幫助數(shù)據(jù)采集預(yù)處理效率提升6.6倍,幫助訓(xùn)練前的數(shù)據(jù)加工更快完成,從而縮短模型開發(fā)周期、降低整體成本。
華為強(qiáng)調(diào)這三款硬盤是面向AI場景的AI SSD,這三款SSD設(shè)計(jì)到數(shù)據(jù)攝取、數(shù)據(jù)預(yù)處理以及模型訓(xùn)練和推理的各個(gè)階段。
為了更好地適應(yīng)AI場景需求,華為還推出DiskBooster驅(qū)動(dòng)軟件,支持AI SSD與HBM、DDR內(nèi)存智能協(xié)同,通過內(nèi)存擴(kuò)展技術(shù)實(shí)現(xiàn)虛擬池化內(nèi)存20倍擴(kuò)展。
同時(shí)該軟件還具備智能多流技術(shù),與上層應(yīng)用配合,有效降低寫放大效應(yīng),進(jìn)一步提升AI SSD壽命。
TrendForce最新調(diào)查顯示,隨著北美地區(qū)主要云廠商持續(xù)投入AI,預(yù)計(jì)將推動(dòng)2025年第三季度企業(yè)級(jí)SSD需求大幅增長。國內(nèi)的云服務(wù)商也在加大AI相關(guān)投入,也會(huì)帶動(dòng)對(duì)于SSD的相關(guān)需求。