從電子醫(yī)療記錄到精準(zhǔn)醫(yī)學(xué)實(shí)踐,數(shù)字化滲透到了醫(yī)療行業(yè)的方方面面,這也意味著會(huì)有大量數(shù)據(jù)產(chǎn)生,醫(yī)療行業(yè)在用橫向擴(kuò)展架構(gòu)存儲(chǔ)提高醫(yī)事服務(wù)效率,提升患者的就診體驗(yàn)。我們看到:
在電子醫(yī)療記錄(EHR)中,醫(yī)生以口語(yǔ)的方式輸入病歷信息,同時(shí)與患者進(jìn)行互動(dòng);在醫(yī)療成像環(huán)節(jié),各種MRI、CT等醫(yī)療影像以數(shù)字化的形式進(jìn)行歸檔;類似的,數(shù)字病理學(xué)將病理載玻片的圖像數(shù)字化,以高分辨率圖像保存并分享查看,配合基因測(cè)序還可以進(jìn)行精準(zhǔn)醫(yī)療。
在媒體和娛樂(lè)行業(yè),如今要管理的非結(jié)構(gòu)化數(shù)據(jù)越來(lái)越多,越來(lái)越高的分辨率會(huì)占用越來(lái)越大的存儲(chǔ)容量,而且,這些數(shù)據(jù)很難快速搜索、編輯和分析,管理和使用占用的資源和投入的成本越來(lái)越高,使得行業(yè)整體利潤(rùn)空間也越來(lái)越小。
媒體和娛樂(lè)行業(yè)首先希望提高內(nèi)部的工作流效率,希望花費(fèi)盡量少的時(shí)間來(lái)復(fù)制和傳輸文件,提高內(nèi)容制作的效率并減少返工所花費(fèi)的時(shí)間。同時(shí),媒體和娛樂(lè)行業(yè)希望具備擴(kuò)展性,適應(yīng)容量、并發(fā)性不斷變化的需求,進(jìn)而提高效率并降低成本,最終提高行業(yè)競(jìng)爭(zhēng)力。
可見(jiàn),在越來(lái)越多的行業(yè)里,如何高效存儲(chǔ)并利用非結(jié)構(gòu)化數(shù)據(jù)是越來(lái)越重要了。IDC數(shù)據(jù)預(yù)計(jì),到2025年,80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),Gartner的數(shù)據(jù)也顯示,從2019年到2024年,非結(jié)構(gòu)化數(shù)據(jù)容量預(yù)計(jì)將增加兩倍。
非結(jié)構(gòu)化數(shù)據(jù)的挑戰(zhàn)和PowerScale的應(yīng)對(duì)之道
非結(jié)構(gòu)化存儲(chǔ)已是避不開(kāi)的問(wèn)題,從應(yīng)用的角度看,在以上幾個(gè)場(chǎng)景以及更多非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)場(chǎng)景中,對(duì)于存儲(chǔ)提出的挑戰(zhàn)主要有以下這幾個(gè)方面:
面對(duì)不斷增長(zhǎng)的數(shù)據(jù),需要存儲(chǔ)系統(tǒng)具有更強(qiáng)的擴(kuò)展性;
面對(duì)多種多樣的數(shù)據(jù)類型,需要存儲(chǔ)系統(tǒng)有更豐富的存儲(chǔ)接口;
面對(duì)非結(jié)構(gòu)化數(shù)據(jù)變現(xiàn)難的問(wèn)題,需要存儲(chǔ)系統(tǒng)能更好地支持?jǐn)?shù)據(jù)分析應(yīng)用。
PowerScale是戴爾科技集團(tuán)在2020年推出的新一代分布式文件存儲(chǔ)方案,它脫胎于橫向擴(kuò)展NAS存儲(chǔ)平臺(tái)Isilon,將業(yè)界領(lǐng)先的橫向擴(kuò)展文件系統(tǒng)OneFS與經(jīng)典的PowerEdge服務(wù)器相結(jié)合,可高效地存儲(chǔ)、管理和分析非結(jié)構(gòu)化數(shù)據(jù),為在各個(gè)場(chǎng)景中的應(yīng)用提供了強(qiáng)大的支撐能力。
PowerScale可解決常見(jiàn)的非結(jié)構(gòu)數(shù)據(jù)帶來(lái)的挑戰(zhàn)。
首先,PowerScale具有非常高的彈性和可擴(kuò)展性,能根據(jù)用戶需求自由伸縮,從最小11TB擴(kuò)展到93 PB,可在單個(gè)命名空間里存儲(chǔ)海量數(shù)據(jù)。在運(yùn)維管理環(huán)節(jié),擴(kuò)容增加新節(jié)點(diǎn)的時(shí)候也非常輕松便捷。
同時(shí),PowerScale面向豐富的應(yīng)用場(chǎng)景,包括NFS、SMB、HDFS、S3、REST等豐富的接口可以對(duì)接各種類型的應(yīng)用,對(duì)接包括公有云、邊緣節(jié)點(diǎn)在內(nèi)的各個(gè)數(shù)據(jù)源的數(shù)據(jù)。
在數(shù)據(jù)洞察方面,PowerScale結(jié)合CloudIQ和DataIQ獲得關(guān)于基礎(chǔ)架構(gòu)和非結(jié)構(gòu)化數(shù)據(jù)的洞察力,CloudIQ用于運(yùn)行狀態(tài)監(jiān)控,DataIQ可以管理數(shù)據(jù),幫助企業(yè)遷移、管理、并利用數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)化為洞察力。
PowerScale是分布式文件存儲(chǔ)領(lǐng)域的一個(gè)標(biāo)桿,一直被模仿從未被超越。憑借PowerScale和對(duì)象存儲(chǔ)ECS,戴爾科技集團(tuán)在《Gartner分布式文件系統(tǒng)和對(duì)象存儲(chǔ)魔力象限》中,連續(xù)五年持續(xù)處于領(lǐng)導(dǎo)者象限,足見(jiàn)Gartner對(duì)于其產(chǎn)品方案的落地價(jià)值和技術(shù)前瞻性方面的認(rèn)可。
在產(chǎn)品落地方面,近期戴爾科技集團(tuán)宣布PowerScale/Isilon通過(guò)Cloudera最嚴(yán)苛的質(zhì)量控制測(cè)試套件(QATS)認(rèn)證。據(jù)了解,戴爾是極少數(shù)通過(guò)這一認(rèn)證的存儲(chǔ)公司,意味著PowerScale/Isilon可以充分發(fā)揮Cloudera大數(shù)據(jù)分析解決方案的功能特性,打通了從數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)分析的高速通道。
在技術(shù)前瞻性方面,戴爾最早將全閃存介質(zhì)引入到非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)領(lǐng)域,并引領(lǐng)著非結(jié)構(gòu)化存儲(chǔ)進(jìn)入了全閃存時(shí)代。
非結(jié)構(gòu)化存儲(chǔ)的進(jìn)入全閃存時(shí)代
閃存能持續(xù)提供穩(wěn)定的高性能表現(xiàn),讓部分需要可預(yù)測(cè)性能的用戶得償所愿。
比如,在芯片設(shè)計(jì)行業(yè),閃存存儲(chǔ)提供的高性能表現(xiàn)可加快芯片的研發(fā)進(jìn)程,早日將芯片投入市場(chǎng)中。此外,在基因組學(xué)和人工智能數(shù)據(jù)大型存儲(chǔ)庫(kù),在高性能計(jì)算(HPC)場(chǎng)景也都需要存儲(chǔ)具備可無(wú)縫擴(kuò)展的容量和性能。
來(lái)自企業(yè)戰(zhàn)略集團(tuán)(Enterprise Strategy Group)的研究發(fā)現(xiàn),為了跟上數(shù)字業(yè)務(wù)的需求,企業(yè)受訪者將大數(shù)據(jù)/數(shù)據(jù)湖存儲(chǔ)庫(kù)列為投資最多的三大場(chǎng)景之一,而要想充分釋放數(shù)據(jù)潛力,需要文件存儲(chǔ)不僅要足夠大,還要易于管理,速度也必須快。
另一項(xiàng)來(lái)自ESG的研究表明,企業(yè)對(duì)于閃存和全閃的需求在增長(zhǎng)。
實(shí)際使用閃存技術(shù)的企業(yè)首先認(rèn)可閃存對(duì)于應(yīng)用性能提升的價(jià)值,近半數(shù)企業(yè)認(rèn)為閃存有助于改善TCO,還有超三分之一的企業(yè)認(rèn)為閃存有助于減少運(yùn)營(yíng)費(fèi)用,減少了硬件上的資本支出。
戴爾的非結(jié)構(gòu)化存儲(chǔ)產(chǎn)品線也在向閃存大步邁進(jìn)。
戴爾的文件存儲(chǔ)產(chǎn)品線中,原來(lái)的Isilon既有歸檔型的存儲(chǔ),也有混合型存儲(chǔ),還有全閃存的存儲(chǔ),而2020年發(fā)布的PowerScale全系都是全閃存存儲(chǔ),包括F200,F(xiàn)600和最新發(fā)布的旗艦型號(hào)F900,戴爾主推的PowerScale似乎是宣告著非結(jié)構(gòu)化存儲(chǔ)進(jìn)入了全閃存時(shí)代。
F900配有雙路的英特爾Xeon處理器,采用高性能的全NVMe閃存,支持英偉達(dá)的GPUDirect技術(shù),讓GPU直接快速地連到存儲(chǔ)。每個(gè)2U的節(jié)點(diǎn)可放置24塊NVMe SSD,單節(jié)點(diǎn)容量最少46TB,最高368TB,集群從三節(jié)點(diǎn)起步,最多252個(gè)節(jié)點(diǎn)。
F900集群可提供高達(dá)1.5TB/s的速度,支持高達(dá)100GbE的網(wǎng)絡(luò)連接。此外,剛剛發(fā)布的OneFS 9.2對(duì)于PowerScale F200/F600的性能提升也非常明顯。
NVIDIA企業(yè)計(jì)算主管Manuvir Das表示,“通過(guò)NVIDIA GPUDirect Storage,戴爾PowerScale F900為醫(yī)療保健、金融服務(wù)、汽車和更多行業(yè)的廣泛客戶提供了強(qiáng)大的存儲(chǔ)平臺(tái),確保其基礎(chǔ)設(shè)施針對(duì)人工智能應(yīng)用場(chǎng)景實(shí)現(xiàn)了優(yōu)化。”
PowerScale的使用非常靈活,PowerScale可輕松與包括F200、F600以及Isilon的歸檔存儲(chǔ)、混合存儲(chǔ)以及全閃存戶節(jié)點(diǎn)混合使用,可輕松利用原有資產(chǎn)。PowerScale可以在本地部署,也可以在公有云上使用,可以以一體機(jī)的方式交付,也可以以即服務(wù)的形式使用。
結(jié)束語(yǔ)
作為一款久經(jīng)考驗(yàn)的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)解決方案,PowerScale繼承了Isilon的優(yōu)良特性,在越來(lái)越多的場(chǎng)景中得到應(yīng)用。在新的時(shí)代背景下,在閃存技術(shù)的發(fā)展和成本降低的趨勢(shì)下,在應(yīng)用需求的推動(dòng)下,PowerScale宣告非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)向全閃存邁進(jìn)。