朱朋博 發(fā)表于:14年11月10日 15:24 [翻譯] DOIT.com.cn
可能今年對我來說最一言難盡的話題就是“為什么我應該使用SSD”?
每每被問及,我總會先埋頭思考沉默一會兒,想想該從哪兒說起。
有一天晚上,我打算以一個關(guān)于存儲類型簡短的故事說起,隨后全面展開關(guān)于“為什么磁盤的沒落讓我很不解”的討論,最后還是覺得不合適。
于是我換另一個角度思考“傳統(tǒng)磁盤的核心競爭力在哪里?”
被低估的磁盤
單位容量的磁盤確實要比SSD便宜。在特定情況下,磁盤的順序?qū)懭胨俣壬踔帘纫恍㏒SD還要快。
如果不小心刪除了磁盤上的數(shù)據(jù),你可能還可以恢復它。而且磁盤的寫入使用壽命遠遠高于SSD。
如你所知,它的缺點也是一大堆。雖然明顯要比SSD便宜,消費端也是如此,好的,我也承認:但那正是分層存儲的意義所在。
我可以拿一塊LSI RAID控制器為小型公司做一個還不錯的混合存儲陣列,如果這些還滿足不了需求,還能求助于Tintri, Tegile, Maxta, SimpliVity, Nutanix或別的上百家可存儲供應商,分層并不是非誰不可。
我能想到順序?qū)懭霑r的兩個確切的工作場景。第一個就是對“單一源的,大量數(shù)據(jù)捕捉”,這在錄制高清視頻的時候比較常見。
大量數(shù)據(jù)需要被寫入,在這過程中沒有別的進程參與進來。
SSD不適合這種情況,因為還沒有出現(xiàn)足夠好、足夠便宜、足夠快的寫入一次讀取多次的SSD,對于那些不活躍但是需要長期保存的數(shù)據(jù),目前為止,磁性存儲仍是最好的選擇。
檔案備份是第二個要考慮的場景。因為用SSD做備份就顯得太二了。有時候,從出錯的文件系統(tǒng)里面提取出數(shù)據(jù)是一件很痛苦的事兒。
失敗的戰(zhàn)斗
與磁盤的比較暫時告一段落,接下來再說一下磁帶。
我能設想到順序讀寫有時候并不意味著什么。作為我對虛擬桌面基礎架構(gòu)研究的一部分,我花了很多時間來分析磁盤 I/O模型,我最終發(fā)現(xiàn)即使是最新的臺式機也花了許多時間來刷高IOPS。
用戶跑在桌面電腦上的程序少說有幾十個多則有上百個,很多都在默默地做小的讀寫操作,很少有誰對讀寫的要求非常高。
服務器的情況更糟。所有的東西都在虛擬化,這就意味著,寫到實際存儲介質(zhì)上的數(shù)據(jù)不關(guān)心原始的來自服務器操作系統(tǒng)的請求是不是順序性的。
如果存儲設備處理的是成百上千并發(fā)請求的話,最終就變成了一系列隨機I/O。
寫入壽命的意義
這就涉及到寫入壽命的問題。我們先從錯誤率說起,這很難,因為并不是所有的廠商都會公布這些數(shù)字。有些廠商的出貨量非常之大,所以樣本量也有很大不同。
當然,你也不能完全相信廠商的數(shù)據(jù),我們盡可能的自己做一些驗證。
我自己也定制了一個廠商和產(chǎn)品的黑名單,我確定那些賣零件或者白盒系統(tǒng)的人也會這么整。
幸運的是,Hardware.fr的Marc Prieur在一段時間以來,跟蹤調(diào)差并公布了法國境內(nèi)零售的零件的返廠率,這為我們真實地展示了真實世界里的回報率。
傳統(tǒng)磁盤和SSD表現(xiàn)出來不相上下的返廠率。一個好的模型的返廠率可降低返廠率,而一個有問題的產(chǎn)品的返廠率的要高出2%。任何超過4%的返廠率都是慘不忍睹的。
在我們繼續(xù)進行有關(guān)SSD和磁盤的討論之前,我們要先把OCZ扔出窗戶。我們從Hardware.fr對SSD的跟蹤調(diào)查開始說起。
OCZ有一個獨立的產(chǎn)品—OCZ Octane SATA 2 128GB,它的返廠率居然都在40%以上。Prieur形容這是“災難性”的,我不得不承認。
如果用心的話,我們也能在磁盤領域找到類似的例子。IBM 60 GXP和75GXP Deskstar硬盤驅(qū)動器產(chǎn)品線的外號叫做“Deathstar”(災星)。
這是個十多年來都稱得上著名的外號,甚至維基百科上都有(Death Star)的專門主頁。
大體上,統(tǒng)計數(shù)據(jù)顯示在最初打上粗糙補丁之后,SSD也有了跟傳統(tǒng)磁盤相近的可靠性,當然,也有例外。
如果你一直在一個消費級的SSD下進行高交易工作負載的話,過不了保修期這玩意兒肯定能完蛋。
一樣的,SSD也非常不適合進行大量日志文件的寫入,超大量的小于K字節(jié)大小的數(shù)據(jù)可以分分鐘燒壞一塊SSD硬盤。
無論是磁盤還是固態(tài)盤,都應該選擇適合的應用場景。無論供應商怎么跟你說,把最廉價的桌面磁盤放到NAS或者RAID卡中的做法都顯得太二了。
信任的問題
消費級的SSD的寫入次數(shù)遠遠低于企業(yè)級的MLC數(shù)據(jù)中心級SSD,跟SLC相比更是小巫見大巫。同樣的,消費級磁盤的故障率經(jīng)常高出5%,而且只有糟糕的一年保修期。
最終,在保質(zhì)期內(nèi)得到的才是產(chǎn)品真正的測量數(shù)據(jù)。保質(zhì)期是制造商認為的通過換掉幾塊故障就可以維護好數(shù)據(jù)中心的時間長度。在一定程度上是廠商對自己產(chǎn)品的信心的體現(xiàn)。
很多時候,我們經(jīng)?梢钥吹絊SD的保質(zhì)期比磁盤要高出三年甚至五年,你見過氦氣硬盤的保質(zhì)期嗎?
除非工作負載非常具體的單一數(shù)據(jù)源,大量的數(shù)據(jù)收錄,這適合使用SSD。即使不是完全的SSD,也可以選擇分層存儲或者混合存儲。
SSD非?,有更低的延遲,更省電,更節(jié)省空間。
既然你已經(jīng)看到這里了,并且遵從上述提示來選擇正確使用SSD,那就沒理由不買SSD了吧。一些持有消極態(tài)度的人腦袋里滿滿的都是FUD(恐懼,不確定和懷疑)。
*我曾經(jīng)歷過的最夸張的返廠率就是OCZ家的240%返廠率。為什么返廠率能超過100%呢?那是因為返廠回來的又再次返廠,有時候甚至還有第四次。最后不得不把OCZ的產(chǎn)品全都換掉。
**我就不提300GB Velociraptors了。