閃存峰會(huì)參會(huì)心得篇
美國(guó)閃存峰會(huì)一些熱點(diǎn)分享:
一、CXL。內(nèi)存互聯(lián)的標(biāo)準(zhǔn)技術(shù),今年閃存峰會(huì)最熱的一個(gè)詞就是CXL。所有的廠家都在談,而且有專門(mén)的分論壇,很多廠商推出了相應(yīng)的產(chǎn)品。
三星在會(huì)場(chǎng)上推出內(nèi)存語(yǔ)義(Memory-semantic)SSD,可以直接有CXL的接口,做閃存或內(nèi)存用。這個(gè)會(huì)議上廠商都在談全面轉(zhuǎn)向CXL的話題。但我問(wèn)了很多分析師,也和很多業(yè)內(nèi)人士做了交流,大家都認(rèn)為CXL還處于早期階段,真正在企業(yè)里普遍使用估計(jì)要等3到5年。
因?yàn)镃XL要真正發(fā)揮其優(yōu)勢(shì),可能需要PCle 5.0,看現(xiàn)在的存儲(chǔ)里都是PCle 4.0,PCle 5.0很少,包括存儲(chǔ)節(jié)點(diǎn),支持PCle 5.0的也很少,而且這個(gè)標(biāo)準(zhǔn)出來(lái)也不是特別久,雖然很熱,但我覺(jué)得離大家真正用上還有一段時(shí)間。
第二個(gè)熱點(diǎn)是英特爾傲騰的問(wèn)題。正好開(kāi)會(huì)前一兩天英特爾宣布不再繼續(xù)投入傲騰技術(shù)。當(dāng)然現(xiàn)在還可以買到傲騰,市場(chǎng)上也有庫(kù)存,但以后不會(huì)再有新一代傲騰技術(shù)。這對(duì)整個(gè)SCM產(chǎn)業(yè)有很大的影響,因?yàn)榘硫v發(fā)售量占比最大,相當(dāng)于其它所有的存儲(chǔ)級(jí)內(nèi)存的總和。如果它不做了,市場(chǎng)走向會(huì)如何?
這也是一些初創(chuàng)企業(yè)從傲騰轉(zhuǎn)向CXL,CXL變得很熱門(mén)的原因之一。這個(gè)轉(zhuǎn)向還有點(diǎn)早,因?yàn)檎麄€(gè)CXL生態(tài)還沒(méi)有到來(lái)。轉(zhuǎn)向沒(méi)問(wèn)題,但真正交付時(shí)會(huì)發(fā)現(xiàn)傲騰生態(tài)發(fā)展已經(jīng)快十年,是很成熟的技術(shù),生產(chǎn)交付已成體系,而CXL很新,交付一些項(xiàng)目時(shí)會(huì)比較麻煩。
作為存儲(chǔ)用戶,尤其企業(yè)存儲(chǔ)而言,我們特別需要SCM這層,因?yàn)槠胀ǖ腟SD在性能上相差還是太遠(yuǎn),傲騰SCM很好地補(bǔ)全了這個(gè)空隙。新的SCM如何選品,基本包括三個(gè)可選項(xiàng),三星的Z-SSD,但是PCIe插卡的形態(tài),我們喜歡盤(pán)的形態(tài)。這次峰會(huì)上三星也沒(méi)有展出這樣的產(chǎn)品,我覺(jué)得它不是特別主推,可能未來(lái)會(huì)轉(zhuǎn)向CXL。
東芝有現(xiàn)成的盤(pán)形態(tài)存儲(chǔ)級(jí)內(nèi)存,用的是XL–FLASH,雖然相比傲騰有差距,但比普通閃存快很多。東芝在展會(huì)上也推出了很多軟件補(bǔ)丁做加速。另外在展臺(tái)上大普威基于自己的主控+XL–FLASH顆粒也推出了存儲(chǔ)級(jí)內(nèi)存。
第三個(gè)熱點(diǎn)是PCle 5.0/EDSFF。E3.S未來(lái)可能取代U.2。因?yàn)镃XL很火,但CXL真正發(fā)揮其性能需要到PCle 5.0。并且PCle 5.0的形態(tài)也在發(fā)生變化,現(xiàn)在用的PCle 4.0最通用接口是U.2,但PCle 5.0會(huì)有新的接口——EDSFF,這種新的接口非常流行,而且有很多中規(guī)格。
個(gè)人覺(jué)得E3.S規(guī)格跟U.2的規(guī)格很接近,長(zhǎng)度寬度比較接近,對(duì)服務(wù)器的設(shè)計(jì)改動(dòng)會(huì)比較少,從存儲(chǔ)的角度考慮,E3.S可能會(huì)平滑地替代U.2的SSD接口。其他接口可能會(huì)在大型數(shù)據(jù)中心使用,一般的企業(yè)級(jí)數(shù)據(jù)中心不是很通用的產(chǎn)品。
第四,QLC/PLC,企業(yè)市場(chǎng)預(yù)計(jì)明年加速。閃存和硬盤(pán)成本預(yù)計(jì)5年內(nèi)還是會(huì)有3-5倍的差距。閃存比硬盤(pán)便宜不太可能,但可以更便宜,推出QLC理論上可以做得更便宜。
但基于QLC的消費(fèi)級(jí)盤(pán)很多,企業(yè)級(jí)盤(pán)少,目前市場(chǎng)上能買到的有一家——Solidigm。這家企業(yè)在會(huì)場(chǎng)上也發(fā)布了PLC的盤(pán),這也是未來(lái)的趨勢(shì)。
三星推出了PB級(jí)SSD,說(shuō)支持QLC,但展品寫(xiě)的是TLC,可能QLC是在路標(biāo)里。現(xiàn)在市場(chǎng)上QLC企業(yè)級(jí)盤(pán)很難選,首先國(guó)內(nèi)支持QLC的只有XSKY這一家,因?yàn)樵诖鎯?chǔ)上要做很多優(yōu)化。國(guó)外有很多,如VAST DATA。由于市場(chǎng)上企業(yè)級(jí)的QLC盤(pán)選擇不多,它的價(jià)格沒(méi)有下來(lái),成本沒(méi)優(yōu)勢(shì),市場(chǎng)發(fā)售量就起不來(lái),現(xiàn)在最大的問(wèn)題是市場(chǎng)上可供貨的,支持QLC企業(yè)盤(pán)的產(chǎn)品太少。
第四是SmartNIC/DPU/計(jì)算型存儲(chǔ)。SmartNIC/DPU/計(jì)算型存儲(chǔ)在會(huì)議上爭(zhēng)議很大。計(jì)算型存儲(chǔ)有很多形式——盤(pán)式和卡式,卡式是一個(gè)存儲(chǔ)節(jié)點(diǎn)+一塊計(jì)算卡,盤(pán)式是在SSD上集成ARM CPU,每塊盤(pán)都有計(jì)算能力。但目前市場(chǎng)并不大,競(jìng)爭(zhēng)力減弱,未來(lái)計(jì)算型存儲(chǔ)也會(huì)有一些標(biāo)準(zhǔn),我個(gè)人沒(méi)有看得特別清楚這個(gè)市場(chǎng)。
首先我更傾向于用一個(gè)存儲(chǔ)節(jié)點(diǎn)+一塊計(jì)算卡,成本更低一些,如果每個(gè)盤(pán)上都有一個(gè)CPU成本太高,而且很難找到很多場(chǎng)景把每個(gè)SSD盤(pán)上的計(jì)算功能都用上,這是我比較困惑的地方,但未來(lái)標(biāo)準(zhǔn)化以后可能會(huì)是大市場(chǎng)。
第五是鎧俠正在推出的軟件定義閃存概念,還有以太網(wǎng)接口的SSD。個(gè)人持保留態(tài)度,成功可能性不大。因?yàn)槭畮啄昵耙蕴谠谟脖P(pán)上做過(guò)一次,基本上就是很小眾的市場(chǎng)。而閃存變成以太口也可能是同樣的命運(yùn),可能以后也會(huì)標(biāo)準(zhǔn)化,有標(biāo)準(zhǔn)會(huì)好一點(diǎn)。
軟件定義閃存的架構(gòu)創(chuàng)新
高端存儲(chǔ)變得閃存化,但其架構(gòu)沒(méi)有太大變化,我從軟件定義方面談一談企業(yè)對(duì)全閃的架構(gòu)創(chuàng)新。第一個(gè)廠商是VAST DATA,還沒(méi)有進(jìn)中國(guó),它的產(chǎn)品架構(gòu)做得比較好,就是用SCM做緩存,下面用QLC做真正的數(shù)據(jù)落盤(pán),把成本降得很低。
VAST DATA支持很長(zhǎng)的糾刪碼,支持200+4,相當(dāng)于得盤(pán)率很高。還有重刪壓縮技術(shù),通過(guò)整體架構(gòu)的改良,把成本降下來(lái),號(hào)稱第一家能做到綜合成本比硬盤(pán)便宜的廠商。不過(guò)產(chǎn)品只適合大客戶,小用戶買它不行,比如糾刪碼很長(zhǎng)的優(yōu)勢(shì),200+4,最少200多個(gè)盤(pán),小項(xiàng)目只買三個(gè)節(jié)點(diǎn),產(chǎn)品性價(jià)比肯定上不去,這是做閃存的創(chuàng)新。
第二是閃存文件方面的創(chuàng)新公司——Weka,其最大的特點(diǎn)是NVMe優(yōu)化做得很好,而且把對(duì)象存儲(chǔ)納入進(jìn)來(lái)作為一個(gè)整體,數(shù)據(jù)在上面流動(dòng),把綜合成本降下來(lái)。它不通過(guò)QLC降成本,是通過(guò)接對(duì)象存儲(chǔ)在后端進(jìn)行分層,對(duì)用戶透明,來(lái)把整體成本降下來(lái)。
第三是做塊存儲(chǔ)的廠商——以色列公司Lightsbit,采用NVMe-OF分離的架構(gòu)來(lái)做的,支持的協(xié)議是(NVMe/TCP),NVMe/TCP本來(lái)很小眾,本來(lái)只它一家,現(xiàn)在已經(jīng)成為一個(gè)國(guó)際標(biāo)準(zhǔn),主流廠商現(xiàn)在都支持,比如VMware、EMC。所以NVMe/TCP已經(jīng)成為一個(gè)主流技術(shù)。
第四個(gè)我認(rèn)為是未來(lái)閃存變革的方向——VMware在不久推出的vSAN8新品,把原來(lái)的全閃架構(gòu)全變了,之前是一層緩存一層SSD,就算把硬盤(pán)換成SSD,緩存層也必須有,時(shí)延上做得不是特別好,就很難支持高性能應(yīng)用。
推出vSAN8以后,它變成了單層架構(gòu),緩存層沒(méi)了,數(shù)據(jù)從計(jì)算節(jié)點(diǎn)下來(lái)直接落到NVMe盤(pán)上,NVMe點(diǎn)對(duì)點(diǎn)通信很快,也不占CPU資源,時(shí)延會(huì)降到最低,充分發(fā)揮NVMe閃存的優(yōu)勢(shì)。
我認(rèn)為這是未來(lái)的方向,目前還沒(méi)有看到太多產(chǎn)品往這方面走,因?yàn)楹芏嗟膫鹘y(tǒng)閃存都是兩層架構(gòu),vSAN做出了一個(gè)榜樣,現(xiàn)在已知國(guó)內(nèi)一些廠家已經(jīng)在做這方面的產(chǎn)品,可能明年會(huì)看到國(guó)內(nèi)廠商推出單層架構(gòu)存儲(chǔ)產(chǎn)品。
閃存對(duì)信創(chuàng)存儲(chǔ)的思考
從技術(shù)層面來(lái)看,我的觀點(diǎn)是如果信創(chuàng)存儲(chǔ)用軟件定義存儲(chǔ)的方式做是比較好的思路。原因有兩點(diǎn),因?yàn)槲医o金融信創(chuàng)實(shí)驗(yàn)室做培訓(xùn),他們金融信創(chuàng)實(shí)驗(yàn)室有信創(chuàng)的服務(wù)器,也做了很多的測(cè)試和應(yīng)用,生態(tài)很完善,鯤鵬、麒麟、統(tǒng)信,服務(wù)器的生態(tài)目前是整個(gè)IT生態(tài)里最成熟的一塊,如果存儲(chǔ)的話,軟件定義的話,基于服務(wù)器上面再跑軟件變成存儲(chǔ),自然而然就成為信創(chuàng)存儲(chǔ),用起來(lái)更簡(jiǎn)單一些。
這次可以利用底層成熟的硬件生態(tài),構(gòu)建信創(chuàng)存儲(chǔ)的關(guān)鍵。而且信創(chuàng)存儲(chǔ)也是目前很好的方向,目前在高德納技術(shù)曲線中也是唯一的變革性技術(shù)。
第二個(gè)特點(diǎn)是軟件定義存儲(chǔ)可以兼容現(xiàn)在的服務(wù)器。信創(chuàng)的CPU供貨總是有一點(diǎn)不確定性,畢竟會(huì)受到國(guó)外的一些影響,如果用軟件定義存儲(chǔ)的方式,擴(kuò)容選品會(huì)自由一些。分布式架構(gòu)還有一個(gè)好處,個(gè)人感覺(jué)目前所有的信創(chuàng)服務(wù)器相比X86服務(wù)器的性能和穩(wěn)定性上略有差距,這不得不承認(rèn),但其整個(gè)存儲(chǔ)架構(gòu)是穩(wěn)定的,也會(huì)屏蔽掉一些信創(chuàng)底層硬件不太穩(wěn)定的問(wèn)題。
從周邊產(chǎn)品來(lái)看,介質(zhì)方面,信創(chuàng)存儲(chǔ)介質(zhì)怎么選,硬盤(pán)沒(méi)法選,目前所有的硬盤(pán)廠商只有三家,西數(shù)、希捷,還有東芝,國(guó)產(chǎn)廠家沒(méi)有做硬盤(pán)的,而且大家公認(rèn)硬盤(pán)市場(chǎng)不是未來(lái)的方向。如果要做信創(chuàng)存儲(chǔ)的話,讓存儲(chǔ)程度更徹底,硬盤(pán)就不能用了,只能用閃存。
閃存剛才講還是太貴了,比硬盤(pán)貴3-5倍,希望它能適配最新的便宜的介質(zhì),比如剛才說(shuō)的QLC/PLC,聽(tīng)說(shuō)大普威明年也會(huì)推出新的國(guó)產(chǎn)QLC企業(yè)級(jí)SSD,國(guó)產(chǎn)的QLC盤(pán)有了,可能會(huì)把成本降下來(lái)。
冷存儲(chǔ)怎么辦?沒(méi)有硬盤(pán),可以直接跳過(guò)用藍(lán)光,如果大的,需要長(zhǎng)期存儲(chǔ)的數(shù)據(jù)可以存在藍(lán)光上,國(guó)產(chǎn)廠商也可以選擇。走全閃加藍(lán)光方向構(gòu)造一個(gè)全信創(chuàng)的存儲(chǔ)。
存儲(chǔ)網(wǎng)絡(luò)方面,現(xiàn)在看到以后存儲(chǔ)的網(wǎng)絡(luò)肯定是NVMe -OF,但下面的底層技術(shù)還是傳統(tǒng)技術(shù),以太網(wǎng)或者infiniband、FC,很多廠商都會(huì)習(xí)慣用FC或者infiniband,但這兩者國(guó)內(nèi)都沒(méi)有投入,以太網(wǎng)方面,在信創(chuàng)市場(chǎng),華為、新華三等很多廠商都是以太網(wǎng)支撐的,而以太支撐NVMe就要兩個(gè)技術(shù),一個(gè)是NVMe/TCP,第二個(gè)是RoCE,前者優(yōu)先考慮,因?yàn)閷?duì)交換機(jī)沒(méi)有要求。如果你要RoCE,雖然性能比較好,但要用數(shù)據(jù)中心交換機(jī),目前來(lái)看成本有點(diǎn)高。
總結(jié)
1、如果信創(chuàng)存儲(chǔ)選型,可以優(yōu)先考慮SDS形態(tài),但有些場(chǎng)景SDS不適合,比如金融客戶,后臺(tái)系統(tǒng)可能不需要很大的擴(kuò)展性,但需要高穩(wěn)定性,個(gè)人不建議用軟件定義存儲(chǔ),還是用傳統(tǒng)的存儲(chǔ),比如華為、宏杉都有信創(chuàng)的高端全閃存儲(chǔ)。
2、SDS的全閃,我個(gè)人認(rèn)為未來(lái)單層架構(gòu)是未來(lái)創(chuàng)新方向。
3、信創(chuàng)產(chǎn)品的介質(zhì)肯定要優(yōu)先考慮閃存,因?yàn)橛脖P(pán)沒(méi)有信創(chuàng)的產(chǎn)品,所以需要這些廠商加大對(duì)QLC/PLC的適配。
4、存儲(chǔ)的網(wǎng)絡(luò)優(yōu)先選擇以太網(wǎng)。
5、信創(chuàng)不是一個(gè)封閉的環(huán)境,要安全跟封閉不是等同的關(guān)系,大家應(yīng)該有一個(gè)開(kāi)放的心態(tài)。未來(lái)信創(chuàng)在全球可能IT是兩極市場(chǎng),一個(gè)是以美國(guó)為首的西方國(guó)家,有些是以中國(guó)為首的東方國(guó)家,信創(chuàng)以后也要追求商業(yè)化的成功,不可能只有國(guó)內(nèi)用,肯定也要走出去,生態(tài)上要和全球的IT融合。
(該速記整理未經(jīng)本人審閱)