- 電子倉庫可以支持企業(yè)將每天的備份通過電子方式傳送到恢復(fù)設(shè)施上,在災(zāi)難發(fā)生時就可以縮短傳送的時間。通常,生產(chǎn)服務(wù)器是通過網(wǎng)絡(luò)與恢復(fù)設(shè)施上的磁帶連接的,但有時也需要中間主機(jī)。此外,根據(jù)備份數(shù)據(jù)的數(shù)量,可能還需要按需網(wǎng)絡(luò)服務(wù)(短期內(nèi)的高帶寬)或直接網(wǎng)絡(luò)連接。電子倉庫能縮短RTO,但它不影響RPO。
- 電子日志通過電子方式持續(xù)或按預(yù)定間隔時間傳送自上次備份以來出現(xiàn)的數(shù)據(jù)庫或文件系統(tǒng)變化。這通常是通過專用網(wǎng)絡(luò)實現(xiàn)的。該網(wǎng)絡(luò)將日志傳送至恢復(fù)設(shè)施上的一個專用服務(wù)器,然后再傳送至磁帶。電子日志能縮短RPO,因為數(shù)據(jù)在中斷事故發(fā)生以后很快就能恢復(fù)。它還能縮短將日志傳送到恢復(fù)設(shè)施上所需的時間,從而縮短了RTO。
- 影化能創(chuàng)建數(shù)據(jù)庫或文件系統(tǒng)的復(fù)制品,通常采取的手段是持續(xù)捕捉變化并將這些變化應(yīng)用于恢復(fù)站點。影化是一個異步流程,因此需要的網(wǎng)絡(luò)帶寬比同步鏡像的少,而且比日志所需的帶寬大或者與之持平,但它需要的硬件容量要大一些,因為它需要不斷地應(yīng)用功能。RTO被大幅縮短了(通常在1~8小時內(nèi),取決于適用日志的滯后時間),而RPO則與最后一次接收和應(yīng)用日志的時間接近。
- 鏡像能創(chuàng)建數(shù)據(jù)庫或文件系統(tǒng)的復(fù)制品,采取的手段是將災(zāi)難恢復(fù)設(shè)施上的變化與主站點上的變化前后應(yīng)用或同步應(yīng)用。因此,RTO將被縮短,從20分鐘到幾個小時不等。而RPO也被縮短到只有未完成的工作丟失。帶寬太小或延誤過長將削弱生產(chǎn)系統(tǒng)的性能。備份站點上還需要使用專用硬件(如服務(wù)器或磁盤子系統(tǒng),或者兩種都需要)。
- 幾個物理站點之間的負(fù)載平衡對于非事務(wù)型應(yīng)用而言很常見。通常,事務(wù)型應(yīng)用都放置在一個站點上,而熱備份則放置在其它地方,這降低了恢復(fù)的復(fù)雜性,而且為沖突的解決提供了機(jī)會。
- 熱備份系統(tǒng),如廣域群集器,能提供時間最快的可恢復(fù)性,通常從幾分鐘到一小時不等,因為恢復(fù)系統(tǒng)配備了影化或鏡像功能以及熱備份應(yīng)用環(huán)境,由運行應(yīng)用所需的能力構(gòu)成。此外,自動化災(zāi)難檢測和應(yīng)用恢復(fù)能力是減少宕機(jī)時間的必要條件。如果發(fā)生了災(zāi)難性故障或站點災(zāi)難,那么熱備份系統(tǒng)將自動檢測故障并開始恢復(fù)流程,包括重新啟動應(yīng)用和驅(qū)動網(wǎng)絡(luò)接入。
根據(jù)使用的應(yīng)用、平臺和高可用性方法的不同,企業(yè)在24小時以內(nèi)成功恢復(fù)運行需要支出高額要想選擇正確的技術(shù)和支出水平,企業(yè)必需了解業(yè)務(wù)流程宕機(jī)帶來的直接和間接費用,這通常是通過業(yè)務(wù)影響分析計算得出的。了解每個業(yè)務(wù)流程的可以接受的技術(shù)支持限制有助于企業(yè)縮小恢復(fù)方案的選擇范圍。
行動方案
雖然快速RTE 恢復(fù)費用昂貴,但其它方案?D在3或4天內(nèi)恢復(fù)?D?D可能會威脅到企業(yè)的生存。企業(yè)應(yīng)利用商務(wù)影響分析來幫助評估恢復(fù)投資回報。
對于1類應(yīng)用服務(wù)和2類應(yīng)用服務(wù)(RTO 和RPO 較短),可以使用多站點結(jié)構(gòu)。通常,新的RTE應(yīng)用服務(wù)開始時采用的是單一站點結(jié)構(gòu),并隨著風(fēng)險的加大而轉(zhuǎn)向多個站點。多站點的應(yīng)用結(jié)構(gòu)設(shè)計較為復(fù)雜(例如設(shè)計中必須包含負(fù)載平衡、數(shù)據(jù)庫分區(qū)、數(shù)據(jù)庫復(fù)制和站點同步化等內(nèi)容)。對于非事務(wù)處理型應(yīng)用而言,多個站點可同時運行,將用戶與最近的站點或使用量最小的站點連接。
為了簡化復(fù)雜性,大多數(shù)事務(wù)處理型應(yīng)用都將數(shù)據(jù)庫或磁盤復(fù)制在另一個站點上,但在災(zāi)難沒有發(fā)生時,備用數(shù)據(jù)庫是空閑的。轉(zhuǎn)換至備用站點通常需要15~30分鐘。有些企業(yè)傾向于將數(shù)據(jù)庫分區(qū),在站點之間分?jǐn)偸聞?wù)處理負(fù)載,并且將用于決策支持和報告的數(shù)據(jù)綜合在一起。這將降低站點中斷造成的影響,使它只能影響到一部分用戶。其他企業(yè)則比較傾向于更加復(fù)雜的結(jié)構(gòu),在這些結(jié)構(gòu)中,站點之間具有雙向復(fù)制能力,能保持單一數(shù)據(jù)庫影像。
所有應(yīng)用服務(wù)都需要在災(zāi)難恢復(fù)戰(zhàn)略中包含端-端數(shù)據(jù)備份和脫機(jī)存儲。通常,災(zāi)難恢復(fù)結(jié)構(gòu)將實施指定時間復(fù)制,以驅(qū)動同步備份和恢復(fù)(涉及許多系統(tǒng))。3類應(yīng)用服務(wù)和4類應(yīng)用服務(wù)通常通過備用站點上的磁帶進(jìn)行恢復(fù)。
外包決策
在定義了災(zāi)難恢復(fù)服務(wù)級以后,企業(yè)應(yīng)評估災(zāi)難恢復(fù)戰(zhàn)略:
- 1 類服務(wù)面向關(guān)鍵的應(yīng)用,其RTO和RPO從幾分鐘到1小時或2小時不等。
- 2 類服務(wù)提供的RPO為4小時,RTO為1天以內(nèi)?D?D能滿足那些希望將數(shù)據(jù)影化到恢復(fù)設(shè)施上的企業(yè)的要求。
- 3 類服務(wù)提供標(biāo)準(zhǔn)磁帶恢復(fù)??這些服務(wù)通常是外包的。
- 4 類服務(wù)提供的恢復(fù)時間較長,可以使企業(yè)通過簽訂快速裝運服務(wù)合同來降低費用。
業(yè)務(wù)連貫性流程中的很多功都不能外包,但許多設(shè)備和勞動力可以外包。