如果說(shuō)云存儲(chǔ)是用戶方便且低成本的存儲(chǔ)選擇,那么,這些存儲(chǔ)難題也可以說(shuō)是被轉(zhuǎn)嫁到了云存儲(chǔ)服務(wù)供應(yīng)商身上。
在這種情形下,幾乎所有的云存儲(chǔ)供應(yīng)商都將目光轉(zhuǎn)到了集群NAS上。
什么是集群NAS?
一般來(lái)說(shuō),集群NAS是一種松散耦合的計(jì)算節(jié)點(diǎn)集合。這里所說(shuō)的松散耦合,其實(shí)基本理念同軟件工程里的概念有些相似。在集群NAS中,最小的單位個(gè)體是文件而非數(shù)據(jù)塊,每個(gè)節(jié)點(diǎn)都是獨(dú)立的實(shí)體且擁有無(wú)法被其它節(jié)點(diǎn)所訪問(wèn)的一個(gè)或者多個(gè)卷。當(dāng)用戶存儲(chǔ)數(shù)據(jù)時(shí),數(shù)據(jù)會(huì)以文件形式存放于某個(gè)節(jié)點(diǎn)之上。出于數(shù)據(jù)保護(hù)的考慮,同一集群的其它節(jié)點(diǎn)上可能會(huì)有文件副本,但是卻無(wú)法以文件實(shí)例的形式提供給用戶。也就是說(shuō),集群NAS對(duì)節(jié)點(diǎn)的相互依賴和順序沒有特殊要求。這同數(shù)據(jù)塊方式操作的集群系統(tǒng)有著一定的區(qū)別。
這種工作方式對(duì)于大型的應(yīng)用具有很高的實(shí)用價(jià)值,特別是連續(xù)的文件數(shù)據(jù)流。通過(guò)文件系統(tǒng)的調(diào)度算法,其可以將整個(gè)應(yīng)用隔離成較小且并行的獨(dú)立任務(wù),并將文件數(shù)據(jù)分配到各個(gè)集群節(jié)點(diǎn)上。目前,我們常見到其被應(yīng)用于大型的數(shù)據(jù)庫(kù)查詢搜索、 密集型的計(jì)算、生命科學(xué)、能源勘探以及動(dòng)畫制作等領(lǐng)域。
對(duì)于集群NAS來(lái)說(shuō),硬件只是其中的一個(gè)部件,文件系統(tǒng)以及應(yīng)用同樣是其有價(jià)值的組成部分。目前我們能夠經(jīng)常見到的集群NAS產(chǎn)品包括,BlueArc的Titan和Mercury系列、HP的Ibrix系列、IBM的SoNAS、Isilon的IQ系列、NetApp的Ontap GX等等。
集群NAS架構(gòu)如何適應(yīng)云存儲(chǔ)需求?
今年的集群NAS市場(chǎng)一掃往日的低迷,看起來(lái)一片紅火景象,這主要得益于一些大廠的切入,比如說(shuō)戴爾,比如說(shuō)HP,比如說(shuō)IBM。
那么,這些大廠為什么會(huì)愿意同集群NAS扯上關(guān)系呢?我們可以從IBM對(duì)SoNAS的構(gòu)想中得到一些答案。在同IBM系統(tǒng)與科技部大中華區(qū)存儲(chǔ)產(chǎn)品經(jīng)理金微的交流中,他首先就把SoNAS同云存儲(chǔ)聯(lián)系到了一起。他認(rèn)為,在目前的存儲(chǔ)形勢(shì)下,一方面大量非結(jié)構(gòu)化數(shù)據(jù)持續(xù)增長(zhǎng),對(duì)于存儲(chǔ)系統(tǒng)的要求越來(lái)越高;另一方面,云存儲(chǔ)大規(guī)模的數(shù)據(jù)訪問(wèn)也對(duì)存儲(chǔ)系統(tǒng)提出了要求。此外,包括賽門鐵克、Isilon等在內(nèi)的其它廠商也都將集群NAS的應(yīng)用領(lǐng)域提到了云存儲(chǔ)的級(jí)別上。
在當(dāng)前各類產(chǎn)品都同云計(jì)算、云存儲(chǔ)扯上關(guān)系的時(shí)候,集群NAS應(yīng)該是比較靠譜的應(yīng)用選擇之一。
我們以SoNAS舉例,來(lái)看一下其在云存儲(chǔ)環(huán)境下的架構(gòu)模型。不同廠商的架構(gòu)盡管會(huì)有差異,但是出入不會(huì)太大。
從上圖可以看到,SoNAS在內(nèi) 部數(shù)據(jù)交換方面采用了Infinband網(wǎng)絡(luò),包含Interface Node、Storage Node和Management Node三種處理節(jié)點(diǎn),分別負(fù)責(zé)數(shù)據(jù)對(duì)外交換、數(shù)據(jù)存儲(chǔ)以及數(shù)據(jù)管理工作。在這其中,Interface Node承擔(dān)著數(shù)據(jù)交換的重任,最小為2個(gè)節(jié)點(diǎn),最大為30個(gè)。
我們前面已經(jīng)說(shuō)過(guò),集群NAS的主要部件之一就是其文件系統(tǒng)。 IBM在SoNAS上所采用的分布式文件系統(tǒng)叫做GPFS,用戶可以通過(guò)常見的文件訪問(wèn)協(xié)議、TSM歸檔軟件接口來(lái)操作數(shù)據(jù)。目前,市場(chǎng)上除了SoNAS 這類整合文件系統(tǒng)、x86硬件以及網(wǎng)絡(luò)設(shè)備的產(chǎn)品外,還有單純的文件系統(tǒng)產(chǎn)品,比如賽門鐵克的FileStore。
由于系統(tǒng)的優(yōu)勢(shì),集群 NAS系統(tǒng)可存儲(chǔ)的文件數(shù)量一般都在億級(jí)以上,對(duì)于實(shí)際應(yīng)用來(lái)說(shuō),文件數(shù)量限制基本可以忽略不計(jì)。同時(shí),全局命名空間的大小也都為數(shù)個(gè)PB以上,某些廠商 的全局空間容量甚至可以達(dá)到10PB。
目前,所有廠商的集群NAS設(shè) 備都可以實(shí)現(xiàn)同原有系統(tǒng)的完美過(guò)渡,用戶實(shí)際上只需要進(jìn)行本地或者遠(yuǎn)程遷移就可以將數(shù)據(jù)轉(zhuǎn)移到集群NAS系統(tǒng)中。這種方便的新舊轉(zhuǎn)換也使得很多CIO在構(gòu) 建私有云時(shí)開始考慮利用集群NAS產(chǎn)品??梢哉f(shuō),云存儲(chǔ)市場(chǎng)的被發(fā)掘,為集群NAS拓展出了一個(gè)更為廣大的應(yīng)用領(lǐng)域,這使得越來(lái)越多的廠商開始推出相應(yīng)的 產(chǎn)品。這對(duì)于本來(lái)只是限制在專業(yè)領(lǐng)域的集群NAS來(lái)說(shuō)無(wú)疑是一件好事。不過(guò),其缺點(diǎn)也頗為致命:采購(gòu)成本過(guò)高。一般來(lái)說(shuō),100TB的部署規(guī)模至少要在 100萬(wàn)人民幣以上。因此,也許我們要在云存儲(chǔ)真正大規(guī)模普及后,才能見到集群NAS的身影。