任新勃 發(fā)表于:14年07月31日 20:00 [原創(chuàng)] DOIT.com.cn
2014年7月31日,由DOIT傳媒和存儲(chǔ)在線舉辦的首屆中國(guó)閃存峰會(huì)在亮馬河飯店盛大召開(kāi),在下午舉辦的閃存技術(shù)論壇上高端存儲(chǔ)知識(shí)自媒體西瓜哥做了《Flash for All不等于All Flash!返闹黝}演講,作為自媒體,西瓜哥對(duì)閃存有著自己的理解。
西瓜哥認(rèn)為現(xiàn)當(dāng)前磁盤技術(shù)快速發(fā)展50年,現(xiàn)在基本停滯,沒(méi)有什么新的技術(shù)。而現(xiàn)階段閃存發(fā)展又很快,MLC的SSD的價(jià)格逐漸接近SAS SSD。估計(jì)2018年左右,可能閃存的成本,跟1.5萬(wàn)轉(zhuǎn)的硬盤差不了多少。借著這個(gè)高速硬盤,很多廠商說(shuō)過(guò)幾年以后閃存的成本跟硬盤成本一樣,不要聽(tīng)錯(cuò)了,不是跟硬盤成本一樣,是跟高速硬盤成本一樣。
西瓜哥認(rèn)為內(nèi)存是最快,壽命也非常好,但是內(nèi)存有一個(gè)問(wèn)題就是不能作為一個(gè)永久的介質(zhì)。第二可以看到SLC,閃存剛出來(lái)的時(shí)候基本上都在這里,SLC他寫壽命比較長(zhǎng),現(xiàn)在我們發(fā)現(xiàn)閃存像儲(chǔ)存用以后,直接用MLC。通過(guò)算法的優(yōu)化,也能滿足大部分的需求。閃存重點(diǎn)看兩個(gè)指標(biāo),一個(gè)讀,閃存很快。但是寫的話,閃存的優(yōu)勢(shì)并不特別明顯,單獨(dú)編程寫的蠻快。閃存有一個(gè)垃圾回收的問(wèn)題,他要?jiǎng)h除,每個(gè)閃存寫的時(shí)候,以前東西要?jiǎng)h除。這個(gè)東西處理不好,會(huì)影響整個(gè)系統(tǒng)的性能。還有壽命。就算用SLC的話也是上萬(wàn)次,最高十萬(wàn)次。
西瓜哥認(rèn)為閃存在互聯(lián)網(wǎng)方面應(yīng)用多一些,而在金融領(lǐng)域應(yīng)用比較保守,擔(dān)心什么問(wèn)題?首先現(xiàn)在架構(gòu)基本能夠滿足他的需求,多加一個(gè)硬盤差不多能滿足。第二個(gè)成本,沒(méi)有必要買那么貴的東西,基本要求可以滿足。第三就是可靠性,普通的客戶考慮閃存的最主要的一個(gè)考慮。但是我們應(yīng)該從整個(gè)TCO和購(gòu)買成本來(lái)看這個(gè)問(wèn)題。用戶關(guān)心的成本只是說(shuō)購(gòu)買成本,閃存陣列不貴,這是成本。但是我們要看整體的成本。比如說(shuō)你用閃存陣列的話,你就可以節(jié)省下來(lái)數(shù)據(jù)庫(kù)兩個(gè)License。
西瓜哥又談了一些廠商解決系統(tǒng)可靠性的一些方法。用戶擔(dān)心是一個(gè)介質(zhì)可靠性,閃存的話要看系統(tǒng)可靠性。介質(zhì)可靠性不夠高,看系統(tǒng)可靠性,有很多方法去解決,“現(xiàn)在廠商使用方法列了一下,一個(gè)是超供,100G閃存硬盤,可能128G,超供180G給你,里面只有100G容量,他說(shuō)我一定要超供,超這么多,給你補(bǔ)上去,這個(gè)壽命沒(méi)有問(wèn)題,這是一方面。第二是磨損均衡,兩個(gè)級(jí)別,一個(gè)是SSD級(jí),一個(gè)系統(tǒng)級(jí)。如果說(shuō)你均衡來(lái)寫,整個(gè)閃存壽命就上去了,需要算法去完善這個(gè)東西。針對(duì)整個(gè)系統(tǒng)就更好了,所有閃存硬盤均衡的寫,我跟賴總聊了一下,他用了三四年閃存了,沒(méi)有壞過(guò)一塊硬盤,所以可靠性還是比較好。還有就是技術(shù)的反磨損均衡,什么意思?我看廠商里面主要是華為提出這個(gè)技術(shù)。帶閃存在壽命后期,假如說(shuō)5年壽命,4年的時(shí)候,我采用反磨損均衡。你這個(gè)全是磨損均衡的話,壽命一致的話,到五年以后硬盤可能全部都?jí),同時(shí)換兩張盤代價(jià)高了,數(shù)據(jù)丟了。后期這個(gè)數(shù)據(jù)是一致,你的風(fēng)險(xiǎn)很大。想用硬盤,又不想花錢,還要換新的硬盤,我用反磨損均衡。我這時(shí)候只寫一塊硬盤,把這個(gè)寫壞,再寫別的,逐步替換,充分利用閃存硬盤,這是一種方式。還有容錯(cuò),在知道閃存硬盤跟普通硬盤最大的區(qū)別,企業(yè)級(jí)閃存硬盤是多核CPU,有強(qiáng)大的軟件功能,垃圾收集等等。這些容錯(cuò)的技術(shù),你顆粒壞了,他內(nèi)部可以做修復(fù),可以容錯(cuò)。還有前面講的很多的數(shù)據(jù)壓縮和重刪和數(shù)據(jù)減少的技術(shù)。把這個(gè)寫大量的減少的話,就會(huì)造成你的硬盤的可靠性的提高,相對(duì)用的時(shí)間更長(zhǎng)。算法的優(yōu)化,4K的顆粒跟我的顆粒對(duì)應(yīng)起來(lái),內(nèi)存里面全部算好了,減少寫放大。還有壽命可預(yù)測(cè),你用閃存更放心就是閃存壽命可以預(yù)測(cè)。閃存顆粒是5000次壽命,我寫了多少次是可以知道。有的公司沒(méi)有做這個(gè)功能,但是用戶可以要求他做,我要知道我的硬盤壽命到什么時(shí)候了,我硬盤是3000次壽命,我寫了2000次了,可以知道。”西瓜哥講到。
Flash for All,閃存無(wú)處不在,通過(guò)這些閃存常見(jiàn)的領(lǐng)域,內(nèi)存計(jì)算、實(shí)時(shí)分析、OLTP、VDI、虛擬化是閃存應(yīng)用最多的場(chǎng)合。很多場(chǎng)合也都用到,比如說(shuō)Facebook要建立一個(gè)冷閃存,用戶希望廠商能提供只能寫3次的閃存,因?yàn)楹芏嘤脩魝魃蟻?lái)的照片不會(huì)刪了。還有一個(gè)是歸檔存儲(chǔ)。以后歸檔的數(shù)據(jù)最節(jié)省的還是元數(shù)據(jù)的閃存,很快找到用戶需要的東西。把所有的查詢和管理都放到閃存里,很好的歸檔。所以說(shuō)閃存可以無(wú)處不在。
回歸到主題Flash for All=All Flash?西瓜哥個(gè)人有點(diǎn)保留意見(jiàn),因?yàn)楝F(xiàn)階段來(lái)說(shuō)閃存陣列占的比例還是很小。但是未來(lái)發(fā)展?jié)摿薮蟆?ldquo;2013年SSA收入6667M。企業(yè)級(jí)的SSD收入是40多億。這是真正的主流,全球占的比例不是非常多。這個(gè)市場(chǎng)最熱的地方是美國(guó),北美的地方SSD美洲占了57%。最新的數(shù)據(jù),全閃存陣列SSD占了5%,按流量來(lái)說(shuō)占的比例更少,可能2%,3%。這個(gè)市場(chǎng)占全球來(lái)說(shuō)閃存陣列占全球磁盤陣列市場(chǎng)是小眾,增長(zhǎng)很快,還是非常小眾市場(chǎng),沒(méi)有成為主流。如果是磁盤陣列的市場(chǎng),美國(guó)占了41%,全閃存陣列市場(chǎng)美國(guó)占了57%,這兩個(gè)數(shù)字可以對(duì)比出美國(guó)這個(gè)市場(chǎng)他對(duì)全閃存陣列的需求是最旺盛。中國(guó)的比例還可以,相對(duì)整個(gè)市場(chǎng)不是特別強(qiáng)。”西瓜哥講到。
西瓜哥有個(gè)觀點(diǎn)認(rèn)為不建議全閃存陣列,比較傾向的觀點(diǎn)是混合陣列。“為什么說(shuō)不建議全閃存陣列,首先容易形成系統(tǒng)孤島,把數(shù)據(jù)放到上去,你備份之后,過(guò)一兩年之后,我計(jì)費(fèi)了,這個(gè)月花費(fèi)可能需要很多的I/O,但是交完費(fèi)之后,兩個(gè)月之后這個(gè)數(shù)據(jù)就變了。這個(gè)數(shù)據(jù)放到全閃存陣列成本就浪費(fèi)了。你需要做遷移,一個(gè)基金公司會(huì)估計(jì)一個(gè)遷移成本,數(shù)據(jù)的話假設(shè)你買一個(gè)陣列,把舊的陣列換掉,數(shù)據(jù)遷移,會(huì)算一個(gè)成本。會(huì)購(gòu)買陣列成本的54%,他算的比較多,遷移成本,還有提前購(gòu)買陣列,遷移完了之后還有運(yùn)行一段時(shí)間他把這個(gè)成本算進(jìn)來(lái)。不管怎么算,有一個(gè)概念就是遷移成本,現(xiàn)在的遷移技術(shù)不是特別的成熟。”
混合陣列有幾個(gè)關(guān)鍵特性,首先我認(rèn)為是在線重刪和壓縮你必須要有。小于1毫秒時(shí)延,在全閃存情況下。假設(shè)我需要小于1毫秒時(shí)延你必須要達(dá)到。第三就是加密,為什么強(qiáng)調(diào)加密?大家知道閃存是要操作的,有操作就有一個(gè)問(wèn)題,這個(gè)閃存盤以為刪除了,但是你拿走了以后你會(huì)發(fā)現(xiàn)其實(shí)沒(méi)刪除,你超供的部分有一個(gè)數(shù)據(jù),全部可以恢復(fù)臨時(shí)的數(shù)據(jù)。你給100G閃存硬盤,里面有28G超供,那個(gè)地方你沒(méi)有加密功能,你可能保留不了你的數(shù)據(jù)安全,這是金融行業(yè)特別關(guān)注。還有就是閃存是必須的,元數(shù)據(jù)在內(nèi)存和閃存中。針對(duì)閃存LUN的流程優(yōu)化。自動(dòng)遷移,生命周期管理,和HDD深度融合。如果硬盤做了,系統(tǒng)級(jí)就不用做了,F(xiàn)在很多廠商都做閃存硬盤。
混合陣列我們客戶其實(shí)更關(guān)心的是如何保證性能,怎么區(qū)別傳統(tǒng)陣列+SSD,形態(tài)都是一樣,怎么知道你好,你說(shuō)的技術(shù)會(huì)那么復(fù)雜,我也搞不清楚。這是他最大的問(wèn)題。大家很多講陣列,講I/OPS,有人說(shuō)100萬(wàn),有人說(shuō)60萬(wàn),這個(gè)數(shù)據(jù)比較意義不大。I/OPS不知道你讀多少,寫多少,不知道你是6K還是8K,模式不一樣,所以值不一樣。第三方測(cè)試跟測(cè)試程序一樣,這個(gè)I/OPS前十名列出來(lái)了,前面是閃存陣列,混合陣列,性能方面混合陣列差距不是非常大。差距比較大,關(guān)鍵用戶需要不需要這么多容量。如果你又需要容量和又需要性能的時(shí)候,我這邊他是一個(gè)選擇。如果你需要性能不需要容量,純閃存陣列是你的選擇。
西瓜哥舉例美國(guó)一家混合陣列的初創(chuàng)公司的理念架構(gòu),混合陣列必須要有閃存,因?yàn)樵獢?shù)據(jù)在里面;旌详嚵泻(jiǎn)單到一個(gè)硬盤,元數(shù)據(jù)處理加速必須在閃存陣列完成。中間那一層,沒(méi)有必要,F(xiàn)在高速硬盤成本跟閃存成本很接近。美國(guó)的這個(gè)調(diào)查公司在美國(guó)閃存峰會(huì)發(fā)布的品牌調(diào)查結(jié)果,混合陣列里面認(rèn)可度各大廠商最好,用戶很難認(rèn)可,沒(méi)有幾個(gè)客戶是技術(shù)大拿。如果你講一個(gè)混合陣列,跟傳統(tǒng)廠商有什么區(qū)別,不是什么可以講得清楚。這種形態(tài)的話對(duì)他沒(méi)有利,所以說(shuō)我發(fā)現(xiàn)很多原來(lái)只有混合陣列的公司,現(xiàn)在慢慢推出包裝出來(lái)他們的純閃存陣列。
最后西瓜哥對(duì)于閃存應(yīng)用的憧憬,“以后買一閃存陣列,用戶不要限制我配什么盤,我剛開(kāi)始配全閃存硬盤,過(guò)了兩年我發(fā)現(xiàn)老的數(shù)據(jù)越來(lái)越多,還是一個(gè)陣列,不想再買一個(gè)陣列,加一個(gè)磁盤框,你通過(guò)自動(dòng)遷移方式,自動(dòng)判斷方式,你系統(tǒng)自己會(huì)判斷。像買個(gè)汽車一樣,3D模式,雪地模式,無(wú)極變速,自己變速就可以。你沒(méi)有必要讓我的用戶去考慮這么多,據(jù)統(tǒng)計(jì)一般的企業(yè)不超過(guò)20%,你配20%的閃存硬盤很奢侈了。第二個(gè)是一鍵啟動(dòng),我配所有的介質(zhì)在里面,用戶只需要告訴我,我這個(gè)要多少容量,同時(shí)我要什么,要多長(zhǎng)時(shí)間的時(shí)延。用戶說(shuō)我這個(gè)需要100T容量,需要時(shí)延是毫米級(jí)。我混合陣列怎么判斷,我直接去算。如果我說(shuō)時(shí)延要求到2、3毫秒,我可以給你配,20%的閃存就夠了。這是我的一個(gè)想法,能不能實(shí)現(xiàn)不知道了。”西瓜哥講到。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.