DOIT原創(chuàng) 崔昊 發(fā)表于:13年07月30日 17:23 [原創(chuàng)] DOIT.com.cn
閃存系統(tǒng):不是所有閃存系統(tǒng)都是“合格品”
前不久在某業(yè)內(nèi)廠商的大會(huì)上,該公司的存儲(chǔ)產(chǎn)品線高層曾說(shuō)了這樣一句話:“相比那些初創(chuàng)廠商,我們的閃存系統(tǒng)更靈活、易于擴(kuò)展和適用于企業(yè)應(yīng)用。”雖然這句話帶有著明顯的進(jìn)攻和宣傳味道,但他所說(shuō)的并不是完全毫無(wú)根據(jù)的。
我們可以通過(guò)高端存儲(chǔ)系統(tǒng)和中端存儲(chǔ)系統(tǒng)的區(qū)別來(lái)先為這個(gè)問(wèn)題的發(fā)展做個(gè)預(yù)熱:從2010年開(kāi)始,此后主流存儲(chǔ)供應(yīng)商發(fā)布的存儲(chǔ)系統(tǒng)在容量上的差別越來(lái)越小,往往中端存儲(chǔ)系統(tǒng)的最高配置的盤(pán)片數(shù)量和IOPS性能,與高端存儲(chǔ)系統(tǒng)的中、低端配置幾乎相同,但它們?nèi)匀槐环衷谥卸撕透叨藘蓚(gè)不同的產(chǎn)品系列中呢?
這就要回答一個(gè)問(wèn)題:高端存儲(chǔ)系統(tǒng)和中端存儲(chǔ)系統(tǒng)的區(qū)別是什么——在企業(yè)級(jí)存儲(chǔ)系統(tǒng)中,高端存儲(chǔ)和中端存儲(chǔ)的區(qū)別在早期確實(shí)主要是來(lái)自于容量和性能,因?yàn)榇鎯?chǔ)系統(tǒng)的設(shè)計(jì)涉及到成百上千塊磁盤(pán),確實(shí)具有一定的設(shè)計(jì)難度,但隨著ccNUMA等架構(gòu)的不斷成熟,高端和中端存儲(chǔ)的區(qū)別已經(jīng)不再由性能和容量為主要區(qū)別(尤其是在兩個(gè)產(chǎn)品系列交界的地方),最主要的劃分方式是可靠性和提供的面向企業(yè)級(jí)應(yīng)用的能力。
比如說(shuō)在高端存儲(chǔ)系統(tǒng)上,對(duì)OLTP、OLAP的支持能力更強(qiáng);在可靠性方面高端存儲(chǔ)往往提供6個(gè)“9”的可用性,而中端存儲(chǔ)往往是4或5個(gè)“9”;在安全訪問(wèn)、審核和數(shù)據(jù)加密方面,高端存儲(chǔ)往往支持全局安全特性,而中端存儲(chǔ)則略有差別;在支持主機(jī)、大型機(jī)以及在線升級(jí)方面,高端存儲(chǔ)的水平也會(huì)更高。
在閃存系統(tǒng)上也是同樣的問(wèn)題:并不是全部插入閃存盤(pán)的存儲(chǔ)陣列就是閃存系統(tǒng),這其中又包括兩方面的考量標(biāo)準(zhǔn)。
首先,閃存系統(tǒng)必須要針對(duì)閃存的特性設(shè)計(jì),而不是在基于傳統(tǒng)磁盤(pán)的陣列設(shè)計(jì)上更新閃存盤(pán)。眾所周知,傳統(tǒng)陣列是圍繞著緩存(Cache)展開(kāi)的,由于傳統(tǒng)磁盤(pán)的速度并不夠快,通過(guò)Cache技術(shù),傳統(tǒng)陣列能夠提供讀命中,以降低讀時(shí)延;能夠提供回寫(xiě),以降低寫(xiě)時(shí)延,雖然這會(huì)導(dǎo)致較高的CPU占用率和內(nèi)存占用率,但為了得到更好的性能,我們不得不這樣設(shè)計(jì)。因此,我們不能也無(wú)需在閃存系統(tǒng)上設(shè)計(jì)復(fù)雜的Cache,盡量應(yīng)釋放CPU來(lái)處理更多的IO。
同樣重要的是,由于SSD和傳統(tǒng)磁盤(pán)的延遲性能指標(biāo)差距巨大,如果我們直接將SSD插入傳統(tǒng)陣列,只能發(fā)揮SSD的一小部分性能,需要盡量縮短陣列內(nèi)部IO路徑上各個(gè)模塊的時(shí)延來(lái)充分發(fā)揮SSD的性能。
在系統(tǒng)設(shè)計(jì)——數(shù)據(jù)鏈路的設(shè)計(jì)、盤(pán)片連接、Cache設(shè)計(jì)——上,傳統(tǒng)陣列并不應(yīng)該也不能夠通過(guò)直接插入SSD來(lái)獲得“閃存系統(tǒng)”,一來(lái)這無(wú)法利用閃存的全部?jī)?yōu)勢(shì);二來(lái)在成本上將是十分低效的。
其次,是閃存系統(tǒng)的核心功能與技術(shù)問(wèn)題,SSD的內(nèi)部維護(hù)了一張映射表,記錄了LBA到閃存頁(yè)面的映射關(guān)系,每一個(gè)寫(xiě)IO,都會(huì)導(dǎo)致該映射表被更新,LBA被重新映射到新的閃存頁(yè)面?梢哉f(shuō),SSD天生就是ROW(Redirect On Write,寫(xiě)時(shí)重定向)。
對(duì)于基于SSD構(gòu)建起來(lái)的閃存系統(tǒng),ROW已經(jīng)深深嵌入了其靈魂深處。如果先將底層的SSD打散以實(shí)現(xiàn)塊級(jí)虛擬化,并在此基礎(chǔ)上實(shí)現(xiàn)基于查表而不是基于計(jì)算的LUN映射,那么將會(huì)給閃存系統(tǒng)帶來(lái)無(wú)盡的好處:
1、 可以支持Thin Provisioning,部分克服SSD較貴所帶來(lái)的初始投資過(guò)高的問(wèn)題。
2、 可以支持ROW的快照,實(shí)現(xiàn)快照不影響源LUN的性能,而且快照和克隆完全歸一。
3、 可以支持全局磨損均衡,以減少單塊SSD失效對(duì)陣列帶來(lái)的影響。
4、 可以支持在線重刪,盡量減少對(duì)閃存的擦寫(xiě),以使用延長(zhǎng)壽命,同時(shí)還可以引入價(jià)格低廉的消費(fèi)級(jí)SSD來(lái)支撐企業(yè)級(jí)應(yīng)用。
其中,支持Thin Provisioning(自動(dòng)精簡(jiǎn)配置)和De-Dupe(在線重刪)對(duì)于閃存系統(tǒng)來(lái)說(shuō)意義重大。
雖然閃存在容量?jī)r(jià)格比上正在朝著15k轉(zhuǎn)速SAS逼近,但客觀來(lái)說(shuō),這兩者之間還是存在著一定的差距。閃存盤(pán)的單盤(pán)容量和單盤(pán)價(jià)格目前來(lái)說(shuō)還不適合大規(guī)模、全數(shù)據(jù)中心的部署,如果具有Thin Provisioning(自動(dòng)精簡(jiǎn)配置)技術(shù),就能夠以少量的閃存盤(pán)支撐更多的用戶和應(yīng)用需求,并隨著閃存盤(pán)價(jià)格的下滑與單盤(pán)容量的上升,陸續(xù)以更低的成本購(gòu)買(mǎi)并擴(kuò)充閃存盤(pán)的規(guī)模。
De-Dupe(在線重刪)則是有效降低閃存系統(tǒng)讀寫(xiě)摩擦損耗,提升閃存系統(tǒng)容量的關(guān)鍵技術(shù),正如上文所說(shuō),通過(guò)重復(fù)數(shù)據(jù)刪除技術(shù),將重復(fù)的數(shù)據(jù)進(jìn)行刪除,顯然將降低對(duì)閃存的讀取和寫(xiě)入工作量,也正是在這項(xiàng)指標(biāo)上,許多現(xiàn)在市場(chǎng)上主要的“閃存系統(tǒng)”難以稱得上名副其實(shí),它們中的絕大部分都不支持在線重刪技術(shù)。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.