近年來(lái)存儲(chǔ)數(shù)據(jù)呈現(xiàn)驚人的成長(zhǎng),存儲(chǔ)設(shè)備為了適應(yīng)各種新的運(yùn)用需求??從而使得虛擬帶庫(kù),高清非線編,數(shù)據(jù)化監(jiān)控系統(tǒng)等等不斷出現(xiàn)令人興奮地發(fā)展。存儲(chǔ)設(shè)備不但可支持更高速的傳輸,更大的容量存儲(chǔ),及更高的I/O存取,而且相對(duì)應(yīng)的對(duì)數(shù)據(jù)保護(hù)的技術(shù)也有所進(jìn)展??如snap shot、CDP等等。操作系統(tǒng)也增進(jìn)了對(duì)存儲(chǔ)設(shè)備的支持,如Microsoft Windows 2003推出了一系列對(duì)存儲(chǔ)技術(shù)的支持,如VSS,VDS,MPIO 等。在各廠商的積極創(chuàng)新與努力推展下,各家的儲(chǔ)存設(shè)備功能變得更強(qiáng)大,總體持有成本也有顯著的降低。但性?xún)r(jià)比的提供,不代表使用者就能有效地去駕御他所擁有的存儲(chǔ)設(shè)備,就能充分的應(yīng)用其功能去解決所面臨的IT困境。我們希望能提供一些想法與建議去幫助存儲(chǔ)設(shè)備的使用者如何去規(guī)劃適用的盤(pán)陣功能。

你的傳統(tǒng)盤(pán)陣真的發(fā)揮了它的功能,解決了您的問(wèn)題嗎?

九成以上盤(pán)陣的使用者通常在系統(tǒng)安裝完成后,便不再去進(jìn)行盤(pán)陣系統(tǒng)功能的變更了。

我想有幾種原因:


以上幾點(diǎn)有必要進(jìn)行澄清與糾正.


一般傳統(tǒng)盤(pán)陣的選擇不外乎取決于幾點(diǎn):


有幾點(diǎn)是我們必須要考慮的:


針對(duì)個(gè)別的應(yīng)用必須有相對(duì)應(yīng)的優(yōu)化參數(shù)設(shè)定

I/O的模式:


減少任何可能造成系統(tǒng)增加MTBF的機(jī)會(huì)

○ 使用者可以因任務(wù)的需求來(lái)選擇合適的硬盤(pán),在在線的服務(wù)上,需要的是高I/O傳輸,loading會(huì)較重,他可以選擇Fibre硬盤(pán)及SCSI硬盤(pán),而近線及offline的應(yīng)用,就可以用較經(jīng)濟(jì)的SATA硬盤(pán)來(lái)配合,SAS的盤(pán)陣出現(xiàn)又帶給企業(yè)更具彈性的解決方案,使用者可以在同一個(gè)盤(pán)陣系統(tǒng)進(jìn)行SAS及SATA硬盤(pán)的配置,最后,除了選擇合適容量的硬盤(pán)之外,還必須要考慮硬盤(pán)與盤(pán)陣系統(tǒng)的兼容性;

圖示一:硬盤(pán)應(yīng)用示意圖



○ RAID 設(shè)定:提供多種的容錯(cuò)RAID設(shè)定,以減少硬盤(pán)故障可能影響系統(tǒng)的可用性,尤其RAID6可允許同時(shí)有兩個(gè)硬盤(pán)發(fā)生故障,更大大的提高可用性;

○ 系統(tǒng)的環(huán)境及偵測(cè):企業(yè)的IT環(huán)境必需,一個(gè)好的盤(pán)陣系統(tǒng)陣RAID的功能外,還必須俱備一個(gè)穩(wěn)定持續(xù)的系統(tǒng)環(huán)境.因?yàn)橛脖P(pán)在長(zhǎng)時(shí)間的高速存取會(huì)產(chǎn)生高溫,讀取頭會(huì)因些許的振動(dòng)而導(dǎo)致撞擊盤(pán)片而造成數(shù)據(jù)的損毀.好的盤(pán)陣必須能夠保持系統(tǒng)散熱,風(fēng)流,電壓,電流的持續(xù)穩(wěn)外,更要能夠偵測(cè)整體的狀況,當(dāng)不穩(wěn)定狀況發(fā)生時(shí),還能保持系統(tǒng)及數(shù)據(jù)完整,并能通知管理者清楚的事件反應(yīng),讓管理者能迅速做適當(dāng)?shù)奶幹靡耘懦收弦驗(yàn)椋?br />

I、 二段式風(fēng)扇設(shè)計(jì):溫度過(guò)高,風(fēng)扇自動(dòng)切換高轉(zhuǎn)速

II、事件反應(yīng)機(jī)制:當(dāng)溫度過(guò)高,風(fēng)扇故障,控制器故障時(shí)切換快取模式,或執(zhí)行系統(tǒng)關(guān)機(jī),以保護(hù)整體系統(tǒng)

○ 無(wú)壞點(diǎn)考慮(無(wú)單點(diǎn)故障設(shè)計(jì):由服務(wù)器至盤(pán)陣-叢集節(jié)點(diǎn),端口,多路徑,交換機(jī),冗余控制器,冗余電源,冗余風(fēng)扇)。

○ 容易服務(wù)的模塊化的設(shè)計(jì):重要組件的故障常導(dǎo)致系統(tǒng)無(wú)法繼續(xù)提供服務(wù),或可能導(dǎo)致系統(tǒng)處于不安全的狀態(tài) ,如盤(pán)陣控制器,BBU,電源供應(yīng)器,風(fēng)扇模塊,硬盤(pán)模塊等,要讓重要組件能夠被輕易地更換,迅速排除故障,以繼續(xù)提供服務(wù)。

圖示二:無(wú)壞點(diǎn)及易維護(hù)的模塊化設(shè)計(jì)


圖示三:系統(tǒng)的環(huán)境及偵測(cè)


數(shù)據(jù)安全的保障:

理由:

一般使用者在規(guī)劃RAID時(shí),較常使用的是RAID5,而其它常見(jiàn)的則會(huì)有RAID1,RAID3,RAID4 等等,這些RAID level允許至多一塊盤(pán)故障,并能重建數(shù)據(jù),可是很不辛的事,常見(jiàn)的情況如下:當(dāng)一個(gè)屬于RAID5的硬盤(pán)發(fā)生故障時(shí),系統(tǒng)管理者嘗試換上一塊新的硬盤(pán) 或以現(xiàn)有的熱備援硬盤(pán)進(jìn)行RAID的重建。但是很不幸在重建過(guò)程中在另一塊硬盤(pán)上遇到壞塊,而根據(jù)RAID的同位運(yùn)算奇偶校驗(yàn)功能,他只允許一個(gè)條帶是壞的,才能重新產(chǎn)生原來(lái)的數(shù)據(jù),這個(gè)壞塊將造成RAID在被重建的硬盤(pán)里無(wú)法重建數(shù)據(jù),導(dǎo)致這些數(shù)據(jù)永遠(yuǎn)遺失。若只遇到少數(shù)的壞塊,并且這筆數(shù)據(jù)是關(guān)于系統(tǒng)開(kāi)機(jī)或重要的系統(tǒng)文件的,則可能造成無(wú)法開(kāi)機(jī)的狀況。要避免這種情況發(fā)生可采用下面的方式來(lái)避免:

方式:

○ 重建奇偶校驗(yàn)碼:

可使用盤(pán)陣的奇偶校驗(yàn)功能,他的原理很簡(jiǎn)單,就是將RAID上的數(shù)據(jù)每一個(gè)軌道讀出來(lái)重新進(jìn)行奇偶校驗(yàn),在讀取的過(guò)程中就能先發(fā)現(xiàn)壞塊,而在邏輯硬盤(pán)還未處于降級(jí)狀態(tài)時(shí),這個(gè)壞塊上讀不出來(lái)的數(shù)據(jù)是可以重新產(chǎn)生的,將其余硬盤(pán)上的數(shù)據(jù)進(jìn)行奇偶校驗(yàn)運(yùn)算去還原數(shù)據(jù),再回寫(xiě)入壞塊. 通常磁性媒體上的壞塊是所謂的瞬時(shí)的壞塊,可以借由寫(xiě)的動(dòng)作將壞塊覆蓋。若該壞塊無(wú)法用寫(xiě)的動(dòng)作去修復(fù),則盤(pán)陣會(huì)啟動(dòng)硬盤(pán)的重新分配地址功能,去另行配置保留的扇區(qū)與壞塊的地址進(jìn)行交換,由這個(gè)扇區(qū)去取代壞塊,下次存取這壞塊位置時(shí),實(shí)際是存取這個(gè)新的扇區(qū)

○ 盤(pán)片掃描:

盤(pán)陣的奇偶重建功能,原理很簡(jiǎn)單,可是有個(gè)問(wèn)題,因?yàn)樗鼤?huì)消耗盤(pán)陣控制器的運(yùn)算及占用內(nèi)部頻寬,當(dāng)執(zhí)行奇偶重建等于是對(duì)整個(gè)邏輯硬盤(pán)的重建,會(huì)嚴(yán)重影響整體系統(tǒng)的性能. 盤(pán)片掃描是一個(gè)較好的壞塊偵測(cè)方式,是由盤(pán)陣控制器下命令叫硬盤(pán)自己執(zhí)行校驗(yàn)檢查,當(dāng)硬盤(pán)自己檢查過(guò)程中就能先發(fā)現(xiàn)壞塊,而在邏輯硬盤(pán)還未處于降級(jí)狀態(tài)時(shí),這個(gè)壞塊上讀不出來(lái)的數(shù)據(jù)是可以重新產(chǎn)生的,將其余硬盤(pán)上的數(shù)據(jù),和進(jìn)行奇偶校驗(yàn)運(yùn)算去還原數(shù)據(jù),再回寫(xiě)入壞塊. 通常磁性媒體上的壞塊是所謂的瞬時(shí)的壞塊,可以借由寫(xiě)的動(dòng)作將壞塊覆蓋. 若該壞塊無(wú)法用寫(xiě)的動(dòng)作去修復(fù),則盤(pán)陣會(huì)啟動(dòng)硬盤(pán)的重新分配地址功能,去另行配置保留的扇區(qū)與壞塊的地址進(jìn)行交換,由這個(gè)扇區(qū)去取代壞塊,下次存取這壞塊位置時(shí),實(shí)際是存取這個(gè)新的扇區(qū)

圖示四:盤(pán)片掃描


○ 預(yù)定盤(pán)片掃描:

盤(pán)片掃描可以預(yù)先發(fā)現(xiàn)壞塊,避免壞塊造成數(shù)據(jù)在邏輯硬盤(pán)處于降級(jí)狀態(tài)模式時(shí)丟失,并且只用很少的盤(pán)陣控制器來(lái)操作。 但我們認(rèn)為若能將其何時(shí)執(zhí)行,持續(xù)執(zhí)行進(jìn)行自動(dòng)化操作才能對(duì)數(shù)據(jù)提供更好的保護(hù). 這是就要有所謂的盤(pán)片掃描時(shí)間表,我們可以借由盤(pán)片掃描時(shí)間表提供彈性的時(shí)程安排去執(zhí)行盤(pán)片掃描,例如可以按排不同部門(mén)的數(shù)據(jù)盤(pán),在不同時(shí)段,或非工作時(shí)間去執(zhí)行盤(pán)片掃描,可以更充分地利用盤(pán)陣控制器的運(yùn)算能力及頻寬,

圖示五:預(yù)定盤(pán)片掃描



彈性的RAID設(shè)定:

RAID 的選擇:在安裝盤(pán)陣時(shí)就會(huì)預(yù)先規(guī)畫(huà)應(yīng)該實(shí)行什么樣的RAID來(lái)作為數(shù)據(jù)的存儲(chǔ)空間,以下對(duì)各種不同的RAID level作一個(gè)簡(jiǎn)述

RAID Level 0即數(shù)據(jù)分割,是最基本的方式。在一個(gè)普通硬盤(pán)驅(qū)動(dòng)器上,數(shù)據(jù)被存儲(chǔ)在同一張盤(pán)的連續(xù)扇區(qū)上。RAID 0至少使用兩個(gè)磁盤(pán)驅(qū)動(dòng)器,并將數(shù)據(jù)分成從512字節(jié)到數(shù)兆字節(jié)的若干塊,這些數(shù)據(jù)塊被交替寫(xiě)到磁盤(pán)中。第1段被寫(xiě)到磁盤(pán)1中,第2段被寫(xiě)到磁盤(pán)2中,如此等等。當(dāng)系統(tǒng)到達(dá)數(shù)據(jù)中的最后一個(gè)磁盤(pán)時(shí),就寫(xiě)到磁盤(pán)1的下一分段,以下如此。

分割數(shù)據(jù)將I/O負(fù)載平均分配到所有的硬盤(pán)。由于硬盤(pán)可以同時(shí)寫(xiě)或讀,性能得以顯著提高。但是它卻沒(méi)有數(shù)據(jù)保護(hù)能力。如果一個(gè)磁盤(pán)出故障,數(shù)據(jù)就會(huì)丟失。RAID 0不適用于關(guān)鍵任務(wù)環(huán)境,但它卻非常適合于視頻生產(chǎn)和編輯或圖像編輯。

RAID Level 1是磁盤(pán)鏡像??寫(xiě)到磁盤(pán)1中的一切也寫(xiě)到磁盤(pán)2中,從任何一個(gè)磁盤(pán)都可以讀取。這樣就提供了實(shí)時(shí)備份,但需要的磁盤(pán)驅(qū)動(dòng)器數(shù)量最多,不能提高性能。RAID 1在多用戶(hù)系統(tǒng)中提供最佳性能和容錯(cuò)能力,是最容易實(shí)施的配置,這最適用于財(cái)務(wù)處理、工資單、金融和高可用數(shù)據(jù)環(huán)境。

RAID Level 3包括數(shù)據(jù)分割,另外,它還指定一個(gè)硬盤(pán)來(lái)存儲(chǔ)奇偶信息。這就提供了某種容錯(cuò)功能,在數(shù)據(jù)密集型環(huán)境或單一用戶(hù)環(huán)境中尤其有益于訪問(wèn)較長(zhǎng)的連續(xù)記錄。RAID 3需要同步主軸硬盤(pán)來(lái)預(yù)防較短記錄硬盤(pán)的性能下降。

RAID Level 5類(lèi)似于Level 0,但是它不是將數(shù)據(jù)分成塊,而是將每個(gè)字節(jié)的位拆分到多個(gè)磁盤(pán)。這樣會(huì)增加管理費(fèi)用,但是,如果一個(gè)磁盤(pán)出現(xiàn)故障,則它可以更換,數(shù)據(jù)可以從奇偶和糾錯(cuò)碼中重建。RAID 5包括所有的讀/寫(xiě)運(yùn)行。它需要三到五個(gè)磁盤(pán)來(lái)組成數(shù)據(jù),最適合于不需要關(guān)鍵特性或幾乎不進(jìn)行寫(xiě)操作的多用戶(hù)系統(tǒng)。

RAID Level 6它使用特別的算法去產(chǎn)生二筆的Redundant 數(shù)據(jù)(我們稱(chēng)之為P,Q),擴(kuò)展了RAID 5。它能承受多個(gè)硬盤(pán)同時(shí)出現(xiàn)故障,但是,性能??尤其是寫(xiě)操作卻很差,而且,系統(tǒng)需要一個(gè)極為復(fù)雜的控制器。(Infortrend EonStor 提供了P,Q 同時(shí)產(chǎn)生功能,提供了絕佳的RAID6效用。RAID5,RAID6性能差異近10%)

圖示六:RAID Level 示意圖







RAID 之間的切換

理由:

隨著企業(yè)的成長(zhǎng)數(shù)據(jù)勢(shì)必也會(huì)不斷地增長(zhǎng),相關(guān)的擴(kuò)充及備份方案必需因整體的IT環(huán)境去做調(diào)整,原來(lái)的RAID規(guī)劃可能是配合數(shù)據(jù)庫(kù)隨意運(yùn)用。而現(xiàn)在的運(yùn)用必需轉(zhuǎn)成對(duì)更大條帶大小的支持,或者原有只有RAID5的規(guī)劃,因新系統(tǒng)有RAID6的功能,在原來(lái)的做法上必須將原來(lái)的數(shù)據(jù)備分,再重建RAID邏輯硬盤(pán),再將數(shù)據(jù)灌回。這樣做不但耗時(shí)而且不具彈性.

方法:RAID Migration:

盤(pán)陣可以提供所謂的RAID Migration或者RAID重建功能,RAID Migration可以讓系統(tǒng)管理者來(lái)改變邏輯硬盤(pán)的RAID級(jí)別. 它可以借由進(jìn)行RAID邏輯硬盤(pán)數(shù)據(jù)的重新分配達(dá)成,更先進(jìn)的盤(pán)陣還能在RAID Migration上提供條帶大小的變更. 可以更有彈性地為系統(tǒng)管者提供強(qiáng)大的功能,以應(yīng)IT任務(wù)的需求。

圖示七:RAID Migration:


特殊運(yùn)用的考慮:

a) 近線存儲(chǔ)的運(yùn)用:在近線存儲(chǔ)的運(yùn)用上,盤(pán)陣的角色是處于在線和離線的存儲(chǔ)設(shè)備之間,duty cycle的部分不像在線服務(wù),而是隨時(shí)被叫用,在這種情況下,將硬盤(pán)馬達(dá)關(guān)閉的功能啟動(dòng),讓盤(pán)陣在系統(tǒng)閑置一段時(shí)間后就將硬盤(pán)的馬達(dá)關(guān)閉,而當(dāng)服務(wù)器要存取盤(pán)陣時(shí),盤(pán)陣控制器會(huì)自動(dòng)喚醒馬達(dá),立即回復(fù)服務(wù)功能,硬盤(pán)馬達(dá)關(guān)閉功能可以有效地減少電源的消耗,可以有效地節(jié)省總體的電源達(dá)50%以上.

圖示八:近線存儲(chǔ)的運(yùn)用


b) 非線編及影音多媒體的運(yùn)用:影音運(yùn)用要求的系統(tǒng)能夠提供一個(gè)穩(wěn)定的性能來(lái)輸出,盤(pán)陣對(duì)每一個(gè)I/O的響應(yīng)必須能夠及時(shí)快速,若處理I/O無(wú)法在適當(dāng)?shù)臅r(shí)間響應(yīng),則會(huì)造成影音電影的播放畫(huà)面或影像播放停滯. 如下頁(yè),在讀與寫(xiě)的I/O可以看到很明顯的性能落差,這在多媒體的播放是不允許的。

c) Spiky read performance 


原因:盤(pán)陣的設(shè)計(jì)主要是為數(shù)據(jù)存儲(chǔ)做優(yōu)化處理,故在數(shù)據(jù)的處理上不是以主機(jī)端的最快響應(yīng)速度為目的,其主要任務(wù)是保持?jǐn)?shù)據(jù)的正確性,再將通用型的盤(pán)陣運(yùn)用在媒體播放影音的運(yùn)用中,最常見(jiàn)的問(wèn)題有:

a) 硬盤(pán)的壞塊處理導(dǎo)致主機(jī)端來(lái)不及響應(yīng);

b) 混合的讀寫(xiě)需求讓快取的切換來(lái)不及響應(yīng);

c) 對(duì)單一媒體流(通常是一個(gè)大的連續(xù)的的檔案,如電影影片)及多媒體流(如broadcast,IPTV)的優(yōu)化是無(wú)法同一對(duì)待的。

解決方法:

AV選項(xiàng)通常會(huì)有兩種優(yōu)化選項(xiàng):?jiǎn)我幻襟w流和多媒體流。針對(duì)單一媒體流,盤(pán)陣控制器可從硬盤(pán)預(yù)讀較多的數(shù)據(jù)以供大的媒體流。而多媒體流的優(yōu)化則是盤(pán)陣控制器優(yōu)化內(nèi)存機(jī)制,避免讓多個(gè)服務(wù)同時(shí)落在同一硬盤(pán),因此多媒體流可以盡可能被滿(mǎn)足。

a) 啟動(dòng)盤(pán)陣的最多響應(yīng)時(shí)間:只要RAID邏輯硬盤(pán)不是處于降級(jí)狀況,而硬盤(pán)本身在處理壞塊,或者其它原因無(wú)法在限定時(shí)間內(nèi)響應(yīng),盤(pán)陣控制器可立即由其它硬盤(pán)去算出數(shù)據(jù),并將其立即響應(yīng)至主機(jī)端。

b) 設(shè)定對(duì)單一媒體流的優(yōu)化或多媒體流的優(yōu)化:針對(duì)任務(wù)的需求來(lái)設(shè)定單一媒體流的優(yōu)化或多媒體流的優(yōu)化,盤(pán)陣的內(nèi)存就能依據(jù)設(shè)定來(lái)進(jìn)行最佳化管理。

c) 使用RAID 6也可避免因硬盤(pán)處理壞塊而導(dǎo)致的主機(jī)端來(lái)不及響應(yīng)。

分享到

多易

相關(guān)推薦