RAID技術(shù)既可保障數(shù)據(jù)的安全,也可以提供更有效的數(shù)據(jù)存儲(chǔ)和硬盤容量利用率。在多張盤上存取數(shù)據(jù),I/O操作可以用一個(gè)平衡交迭的方式來提高性能。用多個(gè)硬盤驅(qū)動(dòng)器可延長(zhǎng)平均無故障時(shí)間(MTBF),當(dāng)可以冗余存儲(chǔ)數(shù)據(jù)時(shí),能增加整個(gè)系統(tǒng)的容錯(cuò)性能。為滿足利用率,性能和數(shù)據(jù)保護(hù)等要求,有幾種不同的RAID方式,包括RAID0,RAID1,RAID5和一些復(fù)合方式,如RAID10,RAID50等可供選擇。RAID0可以提供最高的效能,但是沒有容錯(cuò)功能。RAID1可以在兩個(gè)硬盤上進(jìn)行鏡像存儲(chǔ)數(shù)據(jù),但是兩個(gè)硬盤上存儲(chǔ)的資料都是一樣的。RAID5不是把校驗(yàn)碼存在一個(gè)硬盤上。所以當(dāng)一個(gè)硬盤的數(shù)據(jù)丟失時(shí),控制器會(huì)自動(dòng)從每一個(gè)具有校驗(yàn)碼的硬盤中產(chǎn)生損壞的硬盤數(shù)據(jù)。因此要根據(jù)用戶的不同需求來選擇不RAID方式。
  
    技術(shù)的更新造就了SAS和SATA的低廉實(shí)用性;高容量的硬盤驅(qū)動(dòng),可以支持低成本,高容量的盤陣來保護(hù)你的數(shù)據(jù)。但是,相比較光纖通道和SCSI信道的保險(xiǎn)性能,SATA就比較沒有優(yōu)勢(shì)了。因?yàn)樵谑褂肦AID5時(shí),一個(gè)硬盤壞掉了,備援硬盤會(huì)接管重建;但兩個(gè)硬盤同時(shí)壞掉了,就會(huì)引起數(shù)據(jù)丟失或系統(tǒng)崩潰。因此,針對(duì)這些可靠性小的普通硬盤,高級(jí)的保護(hù)數(shù)據(jù)方式就需要能夠預(yù)防多個(gè)硬盤的失靈,并且能提供較高的數(shù)據(jù)容錯(cuò)功能和高有效性。
  
  引人注目的技術(shù):RAID6


    RAID6是RAID5的升級(jí),通過第二層分布式的校驗(yàn)碼來實(shí)現(xiàn)高容錯(cuò)性。(雙重校驗(yàn))。 除了多了一層分布式的校驗(yàn)碼以外,數(shù)據(jù)像RAID5一樣被分散地stripe到每個(gè)硬盤。因?yàn)镽AID5只有一套校驗(yàn)碼,所以如果兩個(gè)硬盤都?jí)牡艋蛟谥亟〞r(shí)發(fā)生錯(cuò)誤,那么數(shù)據(jù)就會(huì)永遠(yuǎn)丟失。但是如果有了RAID6的保護(hù),就算壞掉兩個(gè)硬盤,數(shù)據(jù)也可以被復(fù)原。RAID6不僅能使表現(xiàn)沖突和容量消耗達(dá)到最小,而且能夠提供非常高的數(shù)據(jù)容錯(cuò)度,并且能夠支持多個(gè)硬盤同時(shí)發(fā)生故障。


    校驗(yàn)
      
  
    為什么用RAID6


    根據(jù)上面的描述,RAID5在掉一塊盤時(shí),不用停機(jī)還能保護(hù)數(shù)據(jù)。但是,如果掉兩塊盤,數(shù)據(jù)就會(huì)丟失。雖然掉兩塊盤比掉一塊盤的可能性要小,但是當(dāng)涉及到下面的幾個(gè)原因,掉兩盤的可能性還是會(huì)增大的:
    1. SATA硬盤應(yīng)用量的增長(zhǎng):SATA硬盤有低成本,大容量的好處,但是,其平均無故障時(shí)間(MTBF)比FC和SCSI硬盤的都短。這些硬盤使用率的增大,使同一時(shí)間掉兩塊盤的可能性變大了。
    2. 容量大,重建時(shí)間過長(zhǎng):在一塊硬盤中,如果容量越大,就意味著如果這塊盤壞掉,需要重建數(shù)據(jù)的時(shí)間就越長(zhǎng)。系統(tǒng)在執(zhí)行重建任務(wù)時(shí)就要經(jīng)受巨大的負(fù)載,并且很有可能因此損壞另一塊盤或者是在長(zhǎng)時(shí)間的重建過程中掉第二塊盤。
    3. 人為錯(cuò)誤:當(dāng)一塊盤壞掉時(shí),維護(hù)人員會(huì)用一塊新盤來取代這個(gè)壞掉的盤。但一旦維護(hù)人員不小心拔錯(cuò)了硬盤,就會(huì)造成同時(shí)掉兩塊盤的狀況,RAID數(shù)據(jù)將丟失。
    4. 所用硬盤數(shù)量的增加,很大程度上提高了硬盤預(yù)期故障發(fā)生率:當(dāng)盤陣中增加硬盤的數(shù)量時(shí),很大程度上提高了硬盤預(yù)期故障發(fā)生率。在系統(tǒng)用備援硬盤恢復(fù)數(shù)據(jù)時(shí),其余的硬盤也增加了故障發(fā)生率。因此系統(tǒng)內(nèi)硬盤個(gè)數(shù)越多時(shí),就越需要提升數(shù)據(jù)冗余的安全性。
  
    RAID6技術(shù)恰好提供了可同時(shí)損壞兩塊盤的容錯(cuò)度,很明顯,數(shù)據(jù)存儲(chǔ)急需RAID6 的廣泛應(yīng)用。
  
    RAID6是如何工作的
    RAID6的運(yùn)算法則是用兩個(gè)奇偶數(shù)據(jù)執(zhí)行,P和Q,用兩個(gè)線性的獨(dú)立等式表示。第一個(gè)奇偶數(shù)據(jù)P,和RAID5中的奇偶數(shù)據(jù)一樣,通過等式計(jì)算出:





  
    RAID6的數(shù)據(jù)恢復(fù)
   Q的重建和一個(gè)數(shù)據(jù)塊壞掉
  這個(gè)重建程序和RAID5的重建是相似的。那個(gè)壞掉的數(shù)據(jù)塊將從奇偶數(shù)據(jù)P和所有存有丟失數(shù)據(jù)的塊中取出重建。這個(gè)過程很像RAID5的重建程序。當(dāng)數(shù)據(jù)塊重建完成之后,奇偶數(shù)據(jù)Q能重新生成。
  
  舉個(gè)例子,假設(shè)在Figure1中的奇偶數(shù)據(jù)Q1和數(shù)據(jù)塊D13壞掉了,D13的數(shù)據(jù)就可以從奇偶數(shù)據(jù)P1和其它數(shù)據(jù)塊中恢復(fù)。



  
  重建兩個(gè)壞掉的數(shù)據(jù)塊


    從兩個(gè)壞掉的硬盤里恢復(fù)數(shù)據(jù)的過程是件非常復(fù)雜的事情。根據(jù)這個(gè)奇偶校驗(yàn)方程式,由兩個(gè)等式和兩個(gè)未知數(shù),用矩陣求逆,這兩個(gè)未知數(shù)就能求出來,丟失的數(shù)據(jù)就能恢復(fù)。
  
    假設(shè)數(shù)據(jù)塊D13 和D14是已經(jīng)丟失的。
  
    根據(jù)這個(gè)奇偶校驗(yàn)方程式:



  
    RAID配置的權(quán)衡


    當(dāng)配置一臺(tái)盤陣時(shí),系統(tǒng)管理器必須對(duì)高性能和數(shù)據(jù)安全進(jìn)行全方位的權(quán)衡。例如,如果高性能是優(yōu)先考慮的,RAID10就是最好的選擇。如果數(shù)據(jù)的保護(hù)是首要的,RAID5就是最好的選擇。但是,如在本文里描述的一樣,,在大容量的硬盤中,特別是在使用SATA硬盤的情況下,發(fā)生同時(shí)掉兩塊盤的可能性較高,RAID6可以提供重要的保護(hù)并防止數(shù)據(jù)丟失的性能就很值得考慮采用。與RAID5相比,雖然RAID6有性能方面的損失,但是為改善數(shù)據(jù)安全,這是可以接受的。
  
    優(yōu)化解決方案:Infortrend RAID6


     Infortrend公司已開發(fā)出了能以性能損失最小來提供最高容錯(cuò)度的一款高效率的新RAID6,應(yīng)用在其盤陣中。RAID6具有允許同時(shí)掉兩塊硬盤的容錯(cuò)度,或在降級(jí)的情況下,允許其它硬盤出現(xiàn)壞塊。在以上的情況下,控制器可以在不中斷I/O的情況下恢復(fù)壞盤中丟失的數(shù)據(jù)。
  
    在目前的RAID6解決方案中,Infortrend的RAID6具有重大的性能改善的特點(diǎn)??蛻糁恍枰邮鼙萊AID5多百分之十到百分之十五的性能損失,卻可以使數(shù)據(jù)得到雙層校驗(yàn)的保護(hù),這是非常值得的,客戶對(duì)此大為贊賞.
  
    總結(jié)


    RAID6提供了一個(gè)極高水準(zhǔn)的錯(cuò)誤容許度,并且在沒有宕機(jī)和數(shù)據(jù)丟失的情況下允許同時(shí)掉兩塊盤,對(duì)于那些對(duì)數(shù)據(jù)的容錯(cuò)度要求比較高的客戶來講,RAID6是一個(gè)完美的解決方案。
  

分享到

多易

相關(guān)推薦