鵬云網(wǎng)絡創(chuàng)始人陳靚博士

原AWS核心架構(gòu)師、S3、Glacier存儲項目團隊負責人,華裔科學家陳靚先生表示:傳統(tǒng)企業(yè)應用上云,在存儲方面需要解決:

1)可用性與可靠性,這是用戶最為關(guān)心的問題,當節(jié)點或磁盤故障時,業(yè)務不停,數(shù)據(jù)不丟是必須的。但限于crush機制,Ceph系統(tǒng)在節(jié)點當機時會造成IO中斷,前端業(yè)務會受到一定影響。

2)性能。Ceph基于對象存儲,IO延遲長,而傳統(tǒng)業(yè)務系統(tǒng)對IO延遲比較敏感。

3)應提供豐富的企業(yè)級存儲服務功能,例如,快照/克隆技術(shù)提供快速數(shù)據(jù)恢復、以及多用途數(shù)據(jù)副本等能力;在線遷移能夠根據(jù)實際需求為業(yè)務系統(tǒng)調(diào)整存儲資源配置;QoS功能在多業(yè)務系統(tǒng)復雜環(huán)境下充分保證關(guān)鍵業(yè)務系統(tǒng)的存儲性能供給。

以上這些問題,用戶都可以在產(chǎn)品測試過程中進行實際的驗證和考察,眼見為實。

ZettaStor和原生塊存儲

作為原AWS核心架構(gòu)師、S3、Glacier存儲項目團隊負責人,陳靚先生非常了解對象存儲應對塊數(shù)據(jù)需求的不足。

機緣巧合,2012年,陳靚應南京市政府的感召歸國創(chuàng)業(yè),創(chuàng)辦了南京鵬云網(wǎng)絡科技有限公司,并推出了從最底層開始研發(fā)的ZettaStor DBS軟件定義分布式存儲系統(tǒng),提出了原生塊存儲的概念。

它是以裸設(shè)備方式直接管理底層硬盤,并整合成為塊存儲資源供上層應用來訪問使用,由于并不存在對象存儲的中間轉(zhuǎn)換過程,因此能夠?qū)崿F(xiàn)低延遲的高I/O訪問效率。

考慮到傳統(tǒng)企業(yè)級應用對于功能的需求,ZettaStor DBS還提供了自動精簡配置、快照/克隆、分級存儲、數(shù)據(jù)復制和遷移、SSD緩存加速、QoS管理、訪問控制、多路徑冗余等完整的功能。ZettaStor DBS所具有的機房多級容災、故障域隔離、雙活容災解決方案可以很好滿足企業(yè)級用戶業(yè)務的需求。

ZettaStor DBS以標準的iSCSI/SCSI協(xié)議和私有的LBD協(xié)議對外提供存儲服務,并可以通過對接Cinder API、標準REST接口,可以為OpenStack等云計算管理平臺的統(tǒng)一管理提供技術(shù)支持!

ZettaStor DBS產(chǎn)品架構(gòu)圖

測試中的 “貓膩”

談到原生塊存儲,陳靚表示:其實概念并不重要。在擔任AWS核心架構(gòu)師期間,其內(nèi)部很少談論概念,更多是專注在要解決哪些技術(shù)問題。用戶應該更加專注需要解決的問題,而不應該盲從于概念、標準或者趨勢。其實,關(guān)注問題不同,著眼點也不同。

對于原生塊存儲、非原生塊存儲,測試和驗證將是一個非常重要的方法。但是在測試過程中,也應該結(jié)合實際,謹防被一些“貓膩”手段所蒙蔽。

以可靠性測試為例,重點要考察的是:當集群中磁盤或節(jié)點發(fā)生故障時,數(shù)據(jù)會不會丟失?業(yè)務會不會中斷?中斷的時長是多少?

很多SDS的容錯域都是提前配置好的。以3副本9個節(jié)點為例,通常會配置3個容錯域A\B\C、每個容錯域各3個節(jié)點,每個容錯域保存獨立的副本數(shù)據(jù)。例如當以一個容錯域A的3臺機器都故障時,還有兩2個副本存在,數(shù)據(jù)不會丟失,業(yè)務照常運行,這就是通常所說的能容忍1/3節(jié)點宕機。這樣的要求大多數(shù)廠家都能做到,但如果同時B域或者C域也有機器down機呢?

這就是測試中,用戶需要仔細考察和驗證的。

再以性能測試為例,SSD緩存對性能測試有很大的影響,特別在小數(shù)據(jù)量時,看不出來系統(tǒng)的差異,但在實際中,當數(shù)據(jù)量、負載加大,SSD存在被穿透的可能,這時數(shù)據(jù)就需要落盤(寫到硬盤),這個時候良莠不齊,高低立判。這就是為什么很多以ceph為基礎(chǔ)二次開發(fā)的系統(tǒng)把SSD緩存做為標配的原因,因為一旦沒有SSD加速性能會變得很差。

當系統(tǒng)發(fā)生磁盤/節(jié)點故障,恢復數(shù)據(jù)是否會影響系統(tǒng)性能表現(xiàn)。以Ceph為例,其元數(shù)據(jù)管理和尋址采用的是Crush算法,在節(jié)點動蕩時,元數(shù)據(jù)(其實是ceph內(nèi)部保存的資源列表)發(fā)生變化,會導致大量的沒有必要的數(shù)據(jù)遷移,不僅導致網(wǎng)絡帶寬擁擠,嚴重時會導致業(yè)務系統(tǒng)訪問受影響。

小結(jié)

傳統(tǒng)企業(yè)沒有辦法和互聯(lián)網(wǎng)企業(yè)相比,無論IT管理模式,技術(shù)水平,還是發(fā)展階段,二者完全不同。所謂橘生淮南則為橘,生于淮北則為枳,無論對于互聯(lián)網(wǎng)企業(yè)、云計算服務商,還是對于傳統(tǒng)企業(yè)用戶,服務的對象,面臨場景不同,其選擇也就不同,切不可為商業(yè)化的宣傳所誤導!

分享到

songjy

相關(guān)推薦