DOIT原創(chuàng) 崔昊 發(fā)表于:13年07月30日 17:23 [原創(chuàng)] DOIT.com.cn
移動(dòng)電子很簡(jiǎn)單 但閃存不簡(jiǎn)單
在NAND閃存上移動(dòng)電子,并不是一件簡(jiǎn)單的事情,其移動(dòng)電子的量是非常非常巨大的,一個(gè)電子就代表一個(gè)0或是1,這需要成熟、可靠的閃存控制方法及閃存固件來(lái)確保存儲(chǔ)在NAND閃存上的數(shù)據(jù)是可靠的、安全的。
閃存的硬件可靠性一定程度上體現(xiàn)在“移動(dòng)電子”的可靠性上,就像硬盤驅(qū)動(dòng)器一樣,閃存驅(qū)動(dòng)器也會(huì)隨著時(shí)間的推移產(chǎn)生磨損。磁盤可能因?yàn)闄C(jī)械問(wèn)題(如磁頭損壞(磁頭與旋轉(zhuǎn)盤片接觸的部位)或電機(jī)故障)產(chǎn)生故障。而閃存由于是移動(dòng)電子,有時(shí)它們會(huì)使得一個(gè)NAND單元失效。
隨著時(shí)間的推移失效的NAND單元不斷增加,但是通過(guò)使用成熟的閃存固件,可對(duì)NAND進(jìn)行管理,使得所有的單元在同一時(shí)間磨損失效。這種磨損均衡技術(shù)意味著驅(qū)動(dòng)器可以在其整個(gè)生命周期內(nèi)保留更多的空間,而不會(huì)造成性能的下降,同時(shí)也幫助IT管理人員預(yù)測(cè)和計(jì)劃其閃存解決方案的使用壽命——從本質(zhì)上講,閃存的失效比磁盤發(fā)生故障更加容易預(yù)測(cè)。
磨損均衡有效的避免了閃存在短時(shí)間內(nèi)出現(xiàn)過(guò)多的單元損耗從而影響閃存的容量,雖然閃存的每個(gè)單元仍然局限在一個(gè)非常有限的寫次數(shù)內(nèi)——比如說(shuō)企業(yè)級(jí)的SLC(single-level cell單級(jí)單元)每個(gè)單元在失效前能支持大約100,000次寫操作——但整體來(lái)說(shuō)有效的延長(zhǎng)了閃存的壽命。
更長(zhǎng)的壽命意味著更低的成本,在整個(gè)存儲(chǔ)系統(tǒng)中,單個(gè)閃存盤的更換并不會(huì)出現(xiàn)什么問(wèn)題,但由于使用閃存和傳統(tǒng)15k或10k轉(zhuǎn)速的磁盤得到相同IOPS的前提下,閃存所使用的盤片數(shù)量更少,這代表每更換一個(gè)閃存盤系統(tǒng)中盤片的更新比率會(huì)更高——如果我們假設(shè)SSD和傳統(tǒng)磁盤的可靠性和使用周期(事實(shí)上,這兩者在壽命上已經(jīng)基本持平了,都在3-4年左右),就會(huì)發(fā)現(xiàn)一個(gè)簡(jiǎn)單的數(shù)學(xué)問(wèn)題:
以同樣的6G SSD和HDD作為對(duì)比,6G SSD大概提供20000的IOPS,而6G HDD提供300的IOPS,在同樣得到100萬(wàn)IOPS的存儲(chǔ)系統(tǒng)中(比如華為的Dorado 5100固態(tài)存儲(chǔ)系統(tǒng))中,SSD需要50塊,而HDD需要大約3000塊,如果在兩者壽命持平的條件下,顯然一塊SSD更換的代價(jià)占整個(gè)存儲(chǔ)系統(tǒng)的比例要高出數(shù)十倍。
與此同時(shí),可靠性的問(wèn)題還有另外一面:數(shù)據(jù)的正確性。在NAND閃存上,因?yàn)殚W存(Page或Sector)可能存在的損壞,我們需要謹(jǐn)慎的對(duì)待數(shù)據(jù)讀取或?qū)懭霑r(shí)的損壞、遺漏或是錯(cuò)誤問(wèn)題,這意味著我們必須要關(guān)注閃存盤可靠性的另外一面:數(shù)據(jù)的可靠性。
數(shù)據(jù)的可靠性需要通過(guò)閃存盤固件內(nèi)的算法進(jìn)行校準(zhǔn)。業(yè)內(nèi)流行的方式,包括通過(guò)奇偶校驗(yàn)檢查和LBA標(biāo)簽檢查、循環(huán)冗余檢查(CRC)等方式來(lái)校驗(yàn)數(shù)據(jù),而業(yè)內(nèi)不多的廠商(如華為和英特爾)還通過(guò)高級(jí)加密標(biāo)準(zhǔn)(AES)來(lái)確保數(shù)據(jù)的可靠性——這是一種很有意思的確保數(shù)據(jù)正確的方式:通過(guò)對(duì)數(shù)據(jù)進(jìn)行AES加密,來(lái)校驗(yàn)兩次加密或加密前后數(shù)據(jù),從而確保了數(shù)據(jù)的準(zhǔn)確性。
總的來(lái)說(shuō),閃存的磨損均衡、壽命周期、維護(hù)更新成本還是數(shù)據(jù)的可靠性等等這些有關(guān)閃存的話題,都代表著閃存不是簡(jiǎn)單的可以通過(guò)性能和容量考量的產(chǎn)品。但技術(shù)能否得到充分的利用與不同廠商之間的技術(shù)的差別,卻難以為企業(yè)用戶所了解,尤其是當(dāng)很多閃存相關(guān)技術(shù)的驗(yàn)證都通過(guò)一些我們不常見的技術(shù)名字、指標(biāo)來(lái)呈現(xiàn)時(shí),我們需要的是能夠簡(jiǎn)單檢驗(yàn)閃存盤可靠性、性能與成本的指標(biāo)。
事實(shí)上,在業(yè)界對(duì)于閃存盤的“質(zhì)量”有一個(gè)比較通行的考量方法:一年退回率(ARR)和年故障率(AFR),通過(guò)使用行業(yè)標(biāo)準(zhǔn)方法來(lái)計(jì)算這兩點(diǎn),就能夠預(yù)估出閃存盤在實(shí)際工作環(huán)境中的使用總時(shí)長(zhǎng),而這一數(shù)字的高低將直接影響批量采購(gòu)閃存后的成本和使用體驗(yàn)。
對(duì)于行業(yè)內(nèi)的許多供應(yīng)商來(lái)說(shuō),ARR和AFR是十分殘酷的參照指標(biāo),ARR意味著同一批閃存盤內(nèi)在一年中有多少閃存因故障和容量削減較快而被退回供應(yīng)商;AFR則代表一塊閃存盤在一年內(nèi)發(fā)生故障的概率。
普遍來(lái)說(shuō),較好的閃存供應(yīng)商的ARR數(shù)據(jù)應(yīng)當(dāng)不超過(guò)1%(像華為ARR基本上已經(jīng)可以做到不超過(guò)0.3%),而AFR一般在0.5%-0.7%左右——2007年市場(chǎng)上平均傳統(tǒng)磁盤的AFR數(shù)字是4.85%——這意味著,如果你購(gòu)買的是像華為、英特爾等公司提供的閃存盤,其故障率和退回率將顯著低于原來(lái)的SAS或SATA磁盤,無(wú)論從經(jīng)濟(jì)效益還是運(yùn)維復(fù)雜度上,這顯然是非常明顯的改善。
不過(guò),有關(guān)閃存盤整體水平的考量還有很多標(biāo)準(zhǔn),比如說(shuō)是否支持壓縮(能夠有效提高壽命和性能)、重復(fù)數(shù)據(jù)刪除或是更好的磨損均衡技術(shù),但總體來(lái)說(shuō),壽命、性能、成本、數(shù)據(jù)可靠性、ARR與AFR數(shù)字,是其中非常重要的參照指標(biāo),而這些指標(biāo)數(shù)字的提升,絕不僅僅是“NAND閃存+主流控制器”能夠解決的。
華為的工程師曾經(jīng)向我們透露,在華為的閃存盤研發(fā)過(guò)程中,除了以三星、美光等閃存顆粒廠商保持良好的合作關(guān)系之外,在自研SSD和SSD控制器的歷程中,華為除了早期使用Marvell的控制器之外,到現(xiàn)在已經(jīng)歷經(jīng)了三代SSD和自研ASIC,而正是得益于在SSD領(lǐng)域的技術(shù)拓展,“華為才可以做到針對(duì)SSD的全局資源管理以及深度融合機(jī)制。”
這也就將話題引申到一個(gè)更大的領(lǐng)域:我們不可能只是將閃存盤插入傳統(tǒng)的存儲(chǔ)系統(tǒng),而是要建立一個(gè)針對(duì)閃存而優(yōu)化的存儲(chǔ)系統(tǒng),換句話說(shuō),“不是所有閃存系統(tǒng)都是合格品”。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.