国产精品一区二区av交换,中文字幕人成无码免费视频,永久免费av无码网站性色av,欧美一道本一区二区三区,樱桃熟了a级毛片

“錯(cuò)誤”的硬盤驅(qū)動(dòng)器故障是一個(gè)大問題

genghz 發(fā)表于:13年04月01日 12:56 [轉(zhuǎn)載] 比特網(wǎng)

  • 分享:
[導(dǎo)讀] 磁盤驅(qū)動(dòng)器供應(yīng)商告訴我們,這些年來,有超過一半因?yàn)橘|(zhì)保維修返廠的驅(qū)動(dòng)器歸類到NPF當(dāng)中——意思是未發(fā)現(xiàn)問題。作為一名IT專業(yè)人士,我認(rèn)為這一現(xiàn)象的真正原因,就像困擾許多服務(wù)臺(tái)的那樣,位于“鍵盤和操作人員”之間。

磁盤驅(qū)動(dòng)器供應(yīng)商告訴我們,這些年來,有超過一半因?yàn)橘|(zhì)保維修返廠的驅(qū)動(dòng)器歸類到NPF當(dāng)中——意思是未發(fā)現(xiàn)問題。作為一名IT專業(yè)人士,我認(rèn)為這一現(xiàn)象的真正原因,就像困擾許多服務(wù)臺(tái)的那樣,位于“鍵盤和操作人員”之間。LSI的Rob Ober最近的一篇博客,像一道新鮮的陽光照在了“錯(cuò)誤的驅(qū)動(dòng)器故障”這一難題上,并使我思考為什么這類問題依舊存在。

Ober指出,錯(cuò)誤的故障是一個(gè)主要問題,不僅僅是從Fry's和Newegg(新蛋)購買裸盤的那些愛好者,還有主要數(shù)據(jù)中心的運(yùn)營商。數(shù)據(jù)中心運(yùn)營商像你我一樣,當(dāng)遇到驅(qū)動(dòng)器故障就會(huì)有實(shí)質(zhì)性的成本開銷。舉個(gè)例子:

  • 由于RAID系統(tǒng)重建差不多4TB的數(shù)據(jù)到一個(gè)熱備用驅(qū)動(dòng)器上,系統(tǒng)性能下降經(jīng)常會(huì)持續(xù)好幾天。在分布式環(huán)境中使用向外擴(kuò)展(scale-out)存儲(chǔ),由于重建數(shù)據(jù)需要合并多個(gè)存儲(chǔ)節(jié)點(diǎn),還會(huì)影響到網(wǎng)絡(luò)流量。
  • 有人不得不去更換驅(qū)動(dòng)器

因?yàn)轵?qū)動(dòng)器有敏感的企業(yè)數(shù)據(jù),它必須被保密處理或者銷毀。如果你沒有足夠大到擁有一個(gè)協(xié)議——你的存儲(chǔ)供應(yīng)商會(huì)按照你的要求來更換失敗的驅(qū)動(dòng)器,這可能意味著你還需要為不能返還的驅(qū)動(dòng)器支付成本。

問題是,如今的硬盤驅(qū)動(dòng)器由帶有固件的內(nèi)部微控制器來運(yùn)行。就像你的PC或者M(jìn)ac,該軟件偶爾會(huì)癱瘓或者處理器凍結(jié)。驅(qū)動(dòng)器遇到一系列沒有完成的在開發(fā)過程中調(diào)試的請求和狀態(tài),而它的處理器停止響應(yīng)來自主機(jī)或者RAID控制器的命令。

如果主機(jī)或者RAID控制器報(bào)告這樣的一個(gè)驅(qū)動(dòng)器失敗,那么驅(qū)動(dòng)器會(huì)在脫離主機(jī)和在別處測試時(shí)重新工作良好。(我們都知道,關(guān)閉和打開電源可以解決很多計(jì)算機(jī)的問題)。事實(shí)上,研究表明可以容忍這種類型錯(cuò)誤的故障驅(qū)動(dòng)器作為可靠的,只要在它們重置后,便可以當(dāng)做新的驅(qū)動(dòng)器出廠。

實(shí)際上Ober先生找到了一位不愿透露姓名的數(shù)據(jù)中心運(yùn)營者,與他分享其驅(qū)動(dòng)器故障統(tǒng)計(jì)數(shù)字。這個(gè)數(shù)據(jù)中心盡管比谷歌或者Facebook的標(biāo)準(zhǔn)小,但也擁有相當(dāng)巨大的20多萬臺(tái)服務(wù)器。

他們發(fā)現(xiàn):

  • 他們超過30%的SAS驅(qū)動(dòng)器故障是錯(cuò)誤的,加起來每天10-15個(gè),或者說是千分之一的年度錯(cuò)誤故障率。
  • 直接與服務(wù)器主板相連的SATA驅(qū)動(dòng)器,根據(jù)驅(qū)動(dòng)器供應(yīng)商的長期報(bào)告它有更高的將近50%的錯(cuò)誤故障率,錯(cuò)誤的故障率為驚人的每年1%。

一些廠商正在解決這一問題。五年前,Xiotech和Atrato談到過“自愈”型磁盤陣列,在磁盤停止響應(yīng)指令的時(shí)候它會(huì)執(zhí)行修復(fù)任務(wù)而不是立即開始RAID重建。Xiotech與希捷(Seagate)緊密合作,甚至可以繼續(xù)運(yùn)行帶有一個(gè)表面損壞的驅(qū)動(dòng)器,或者映射訪問繞過它來(將部分)磁頭失效。當(dāng)然,修復(fù)過程當(dāng)中的第一步是在磁盤上執(zhí)行一個(gè)硬重置。

由于行業(yè)的變幻無常,人們的注意力轉(zhuǎn)到了閃存上,自愈型陣列不再時(shí)尚了。Atrato已經(jīng)消失,而Xiotech——現(xiàn)在重新命名的X-IO已經(jīng)顯得褪色,有所關(guān)聯(lián)的是,其最后的獨(dú)立競爭對手Compellent、3Par甚至Nexsan都被收購了。

由于磁盤驅(qū)動(dòng)器是一個(gè)雙巨頭壟斷的市場,它的銷售量大,產(chǎn)品利潤低。我沒望希捷還是西部數(shù)據(jù)(Western Digital)建立一個(gè)可以檢測到錯(cuò)誤故障并自我重置的高度冗余的電路板到驅(qū)動(dòng)器中。但是有幾樣?xùn)|西,包括LSI在內(nèi)的業(yè)界廠商可以做到。

像LSI一樣的SAS控制器供應(yīng)商,可以構(gòu)建錯(cuò)誤故障檢測和復(fù)位功能到控制器中。當(dāng)驅(qū)動(dòng)器響應(yīng)失敗時(shí),控制器會(huì)在RAID開始重建之前給出一個(gè)快速反沖。這在SATA驅(qū)動(dòng)器上比較難,因?yàn)樗鄙僖恍┍匾倪B接。但是控制SATA規(guī)范的人們,在接下來的幾年可能在6-12Gbps升級(jí)中增加一個(gè)硬件復(fù)位功能。簡單點(diǎn)兒說,陣列供應(yīng)商可以增加一個(gè)切斷到單獨(dú)驅(qū)動(dòng)器的電源來強(qiáng)制復(fù)位的功能。

無論你如何切斷它,1%的AFR是不可接受的。這個(gè)行業(yè)應(yīng)該致力于真正的解決方案,而不只是更快的重建(rebuild)。

[責(zé)任編輯:鄭磊]
存儲(chǔ)在線今天就云存儲(chǔ)、WD各系列硬盤、SSD、軟件定義存儲(chǔ)等一系列熱門話題,與西部數(shù)據(jù)全球云儲(chǔ)存產(chǎn)品高級(jí)總監(jiān)Patrick Wilkison進(jìn)行深入的探討。
官方微信
weixin
精彩專題更多
存儲(chǔ)風(fēng)云榜”是由DOIT傳媒主辦的年度大型活動(dòng);仡2014年,存儲(chǔ)作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素,已經(jīng)成為了推動(dòng)信息產(chǎn)業(yè)發(fā)展的核心動(dòng)力,存儲(chǔ)產(chǎn)業(yè)的發(fā)展邁向成熟,數(shù)據(jù)經(jīng)濟(jì)的概念順勢而為的提出。
華為OceanStor V3系列存儲(chǔ)系統(tǒng)是面向企業(yè)級(jí)應(yīng)用的新一代統(tǒng)一存儲(chǔ)產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達(dá)到業(yè)界領(lǐng)先水平,很好的滿足了大型數(shù)據(jù)庫OLTP/OLAP、文件共享、云計(jì)算等各種應(yīng)用下的數(shù)據(jù)存儲(chǔ)需求。
聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會(huì)
 

公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會(huì)員注冊 | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.