二。傳統(tǒng)數(shù)據(jù)保護(hù)方法

1。備份 

全備份/恢復(fù)

全備份/恢復(fù)用于所有的數(shù)據(jù)類型,是最常見的數(shù)據(jù)保護(hù)方法。該方法對數(shù)據(jù)進(jìn)行100%復(fù)制,通常是一個完整的文件或卷,從主磁盤復(fù)制到磁帶或備份磁盤。備份副本是不可執(zhí)行的,并且必須通過恢復(fù)才可以被應(yīng)用程序進(jìn)行訪問。多數(shù)情況下,傳統(tǒng)的備份和從其副本恢復(fù)過程會對應(yīng)用程序又影響甚至需要中斷應(yīng)用程序。

備份或恢復(fù)的對象越大,應(yīng)用程序及其用戶等待的時間就越長。對于關(guān)鍵業(yè)務(wù)或產(chǎn)生收益的應(yīng)用程序,等待完成備份或恢復(fù)操作的任何時間都意味著花銷。

文件或卷的全備份和恢復(fù)是數(shù)據(jù)保護(hù)技術(shù)中是最耗時的,而且可能不易安排。數(shù)年的研究顯示很多備份數(shù)據(jù)與先前備份的數(shù)據(jù)是相同的。備份大量未改變的數(shù)據(jù)產(chǎn)生了大量不必要的重復(fù)冗余數(shù)據(jù),然而作為數(shù)據(jù)保護(hù)策略,全備份和恢復(fù)提供了較高的可信度,因此仍在繼續(xù)被人們使用。

由于備份和恢復(fù)過程的時間消耗特性,傳統(tǒng)的備份/恢復(fù)正在轉(zhuǎn)變?yōu)橐恍┭苌募夹g(shù)。在選擇這些選項來制定有效的備份策略時需進(jìn)行折衷,并且需進(jìn)行認(rèn)真的審查。

增量備份

增量備份對最近一次完全備份或增量備份之后發(fā)生變化的數(shù)據(jù)進(jìn)行備份。由于只對變化的數(shù)據(jù)、文件或塊(根據(jù)具體的實(shí)現(xiàn))進(jìn)行備份,該方法使備份數(shù)據(jù)的數(shù)量最小化,并且縮短了"備份窗口"需要的時間。然而,由于每個增量備份通常必須按順序恢復(fù)到它們最近的狀態(tài),其完全恢復(fù)需要耗費(fèi)更多的時間。這將可能是一個復(fù)雜的且耗費(fèi)時間的過程。通常每周進(jìn)行一次完全備份,每天進(jìn)行一次增量備份。增量備份最小化了備份時間,但恢復(fù)變得更加復(fù)雜。

差異備份

差異備份前一次差異備份的數(shù)據(jù)以及本次與前一次差異備份間新變化的數(shù)據(jù)進(jìn)行備份。這就是完全備份之間的差異備份的容量每天典型地在逐漸增加的原因。這意味著每天的備份在逐漸增大,因此耗費(fèi)更多時間,但是恢復(fù)過程比較容易并且通常比完全備份或增量備份的時間更短。完全的恢復(fù)只需要最近一次的完全備份和最近一次的差異備份即可完成。差異備份耗費(fèi)的時間比增量備份長,但它恢復(fù)得更快。

小結(jié):增量備份最小化了備份時間,而差異備份最小化了恢復(fù)時間,特定的應(yīng)用可以支持其中的一種或另一種。這些利弊權(quán)衡往往讓存儲管理員感到困惑且耗費(fèi)時間。大多數(shù)的企業(yè)都想減少讓人痛苦的備份數(shù)量,同時縮短恢復(fù)的時間,而非只實(shí)現(xiàn)其中的一項。增量備份和差異備份都是針對特定應(yīng)用及備份軟件的。多個應(yīng)用需要多個實(shí)現(xiàn),從而增加了復(fù)雜性。

2。鏡像 

磁盤鏡像

磁盤鏡像用于所有的數(shù)據(jù)類型,使用本地或遠(yuǎn)端磁盤驅(qū)動器實(shí)現(xiàn)塊到塊的文件、邏輯單元或物理磁盤卷的復(fù)制。一旦通過對原始數(shù)據(jù)元素進(jìn)行復(fù)制而建立了鏡像數(shù)據(jù)元素后,所有其后的寫操作將被存儲到兩個(或多個)位置,創(chuàng)建相同或幾乎相同的副本。當(dāng)其中的一個副本出現(xiàn)問題時,磁盤鏡像將提供幾乎是即時的到第二個副本的訪問,從而使應(yīng)用可以繼續(xù)而不會停止。鏡像是高開銷的,它使得需要的磁盤存儲量加倍,顯著增加了初始獲取及正在進(jìn)行的運(yùn)行開銷。同時,存儲管理員必須選擇實(shí)行異步或同步鏡像,需對每種情況進(jìn)行利弊權(quán)衡。同步鏡像經(jīng)常應(yīng)用在主機(jī)及其它應(yīng)用具有關(guān)鍵性特征的高可用環(huán)境中。同步鏡像中,源設(shè)備及目標(biāo)設(shè)備必須在確認(rèn)寫操作已經(jīng)完成后,才能進(jìn)行下一次寫操作。這會降低應(yīng)用的性能,但使得鏡像元素與真實(shí)的(準(zhǔn)確的)數(shù)據(jù)元素相互同步。

異步鏡像

對于異步鏡像,源設(shè)備和目標(biāo)設(shè)備不必同步它們的寫操作,從而允許第二個以及后面的寫操作獨(dú)立進(jìn)行。因此異步鏡像比同步鏡像更快,但是其第二副本會和原本有輕微的失步。異步鏡像有時應(yīng)用于廣域的備份市場以將數(shù)據(jù)復(fù)制到數(shù)百里以外的地方。由于數(shù)據(jù)量龐大,而高速帶寬又價格不菲,這將造成非常高的開銷。實(shí)際中,備份的數(shù)據(jù)相對原數(shù)據(jù)的滯后或失步很少會超過一分鐘。但對于特定的關(guān)鍵任務(wù)的或?qū)懖僮黝l繁的應(yīng)用來說,備份數(shù)據(jù)的滯后或失步將會帶來極大的風(fēng)險。

小結(jié):鏡像應(yīng)用于許多關(guān)鍵任務(wù)的應(yīng)用中,由于其通過自動轉(zhuǎn)換到鏡像副本的恢復(fù)操作在幾秒或者更短的時間內(nèi)即可完成,因此它是硬件子系統(tǒng)或設(shè)備故障時進(jìn)行數(shù)據(jù)訪問的最快方法。 注意鏡像并不能幫助保護(hù)對數(shù)據(jù)的損壞,如黑客、蠕蟲、病毒、入侵、人為或軟件錯誤,而只是生成了兩個或多個侵蝕了的副本。為了最好的效果,鏡像通常應(yīng)和其它能夠恢復(fù)到數(shù)據(jù)受損之前的干凈數(shù)據(jù)的保護(hù)方案一起使用。磁盤鏡像被定義或通常被稱為RAID 1。

三。數(shù)據(jù)保護(hù)新方法

由于傳統(tǒng)的數(shù)據(jù)保護(hù)方法存在折衷及局限問題,其它的一些技術(shù)正在日益發(fā)展以減少傳統(tǒng)方法中的一些局限。

1??煺?/strong>

快照副本給出變化數(shù)據(jù)的一個一致的時間點(diǎn)視圖。眾多的數(shù)據(jù)存儲提供商提供各種各樣的快照實(shí)現(xiàn),但并非所有快照的建立都是相同的。當(dāng)使用快照副本的同時有寫操作發(fā)生時,發(fā)生變化的區(qū)域(寫)被保存到磁盤的一個單獨(dú)的專門為快照活動所保留的存儲區(qū)域或分區(qū)中。這里影響到的區(qū)域或塊的舊值可以被保存以防新的塊被破壞,或者允許建立虛擬數(shù)據(jù)映像,用于不停機(jī)備份。存儲管理員需管理快照的數(shù)量及類型。

小結(jié):照提供了對入侵和數(shù)據(jù)破壞的保護(hù),但沒有對源數(shù)據(jù)設(shè)備的故障進(jìn)行保護(hù)。這里也存在折衷??煺崭北久媾R的挑戰(zhàn)是不易找到正好在數(shù)據(jù)破壞發(fā)生前的那個快照副本,同時當(dāng)快照的數(shù)量增加時復(fù)雜性也在增加?;诙鄠€應(yīng)用及軟件的實(shí)現(xiàn)會使應(yīng)用快照的復(fù)雜性增加

2。CDP

CDP(Continuous Data Protection持續(xù)數(shù)據(jù)保護(hù)) 是使得每個寫或更新操作被持續(xù)地寫入磁盤設(shè)備,該磁盤設(shè)備可能和主設(shè)備相同或不同,在需要的時候能夠恢復(fù)數(shù)據(jù)。如果說快照副本是一系列靜態(tài)的圖像,那么CDP就如同是一部電影。然而與鏡像不同,CDP的第二副本是帶有時間戳的寫事件的連續(xù)歷史。所有的寫操作在從盤或日志設(shè)備中進(jìn)行排隊。典型地日志記錄2~4天的連續(xù)歷史,覆蓋數(shù)據(jù)恢復(fù)最大可能發(fā)生的周期。日記對保護(hù)入侵及數(shù)據(jù)侵蝕尤其有益,它可以完成到發(fā)生數(shù)據(jù)損壞之前時間點(diǎn)的恢復(fù)。稀疏日志用于記錄更加重要的任務(wù)的寫操作。這里存在著利弊權(quán)衡。

小結(jié):CDP和快照副本面臨同樣的挑戰(zhàn),它們不能替代傳統(tǒng)的備份或者在數(shù)據(jù)中心發(fā)生丟失時提供保護(hù)。CDP非常適合對數(shù)據(jù)變化量小的環(huán)境中的數(shù)據(jù)損壞進(jìn)行恢復(fù)?;诙鄠€應(yīng)用及軟件的實(shí)現(xiàn)會使應(yīng)用CDP的復(fù)雜性增加,許多應(yīng)用不支持CDP。

3。VTL

VTL(虛擬磁帶庫Virtual Tape Library)解決方案的數(shù)量在不斷增加,目前備份/恢復(fù)市場中有超過25家公司在提供各種各樣的虛擬磁帶的應(yīng)用。主機(jī)虛擬磁帶的概念最先出現(xiàn)在1997年,并通過IBM和StorageTek開始普及,因?yàn)榇艓Ш械挠行Ю眠M(jìn)入了歷史上的低谷。虛擬磁帶的應(yīng)用帶來的益處有目共睹,VTL現(xiàn)在可在非主機(jī)系統(tǒng)中用作快速磁盤緩存。

虛擬磁帶庫由一個磁盤組構(gòu)成,看上去像屬于磁帶庫的若干磁帶機(jī),但并不包含實(shí)際的物理磁帶庫。VTL通常有兩種類型:集成的和獨(dú)立的。集成的虛擬磁帶庫將磁盤陣列作為前端與自動磁帶庫相結(jié)合,而獨(dú)立的虛擬磁帶庫不直接控制物理磁帶庫。磁盤存儲在大容量且低開銷的磁帶庫中用作高速緩存或緩沖器存儲處理比較活躍的數(shù)據(jù)。在操作系統(tǒng)看來如同多個磁帶機(jī)而非物理磁盤驅(qū)動器,從而把磁盤"虛擬"為自身以外的其它設(shè)備。

虛擬磁帶系統(tǒng)在一個物理磁帶盒中儲存多個虛擬磁帶卷,通??墒勾艓Ш械睦寐蔬_(dá)到80%或更高。隨著磁帶盒容量的快速增加,提高其利用率將變得更加重要。預(yù)定的策略,如文件大小、使用容量及使用頻率決定了何時將數(shù)據(jù)直接移入或移出磁盤緩沖及磁帶庫。這種情況下,類似HSM(分級存儲管理Hierarchical Storage Management)基于策略的功能存在于應(yīng)用服務(wù)器之外,直接控制磁盤和磁帶存儲器間雙向的數(shù)據(jù)移動,從而使得第2級和第3級的存儲間能直接進(jìn)行數(shù)據(jù)傳輸。

小結(jié):虛擬磁帶的益處,如高性能(可以頻繁的從磁盤高速緩存中進(jìn)行數(shù)據(jù)訪問),顯著地增加了磁帶盒的利用率,通過定義多個磁帶動器而非增加物理的并行I/O活動,簡化了備份策略的管理,并且通過減少磁帶驅(qū)動器及介質(zhì)的數(shù)量獲得經(jīng)濟(jì)效益。這里同樣存在著利弊權(quán)衡,因?yàn)橛泻芏喾N技術(shù)可供選擇,確定適合本企業(yè)選擇最佳VTL需要花費(fèi)很多時間。

分享到

多易

相關(guān)推薦