圖1
2、業(yè)務(wù)連續(xù)性不強(qiáng)
數(shù)據(jù)的作用是提供給應(yīng)用進(jìn)行處理和展現(xiàn),所以數(shù)據(jù)的好壞將直接決定了應(yīng)用是否正常。對(duì)于傳統(tǒng)的全備、增量、差異等備份方式來(lái)說(shuō),想使用備份數(shù)據(jù)的時(shí)候必須經(jīng)歷一個(gè)數(shù)據(jù)恢復(fù)的過(guò)程。同樣以周日做全備,周一到周六的每天下午6點(diǎn)做增量備份為例。如果當(dāng)前的時(shí)間是周六的上午,源數(shù)據(jù)的存儲(chǔ)介質(zhì)損壞,導(dǎo)致源數(shù)據(jù)丟失,此時(shí)在修復(fù)存儲(chǔ)介質(zhì)后要首先恢復(fù)上周日的全備份,然后依次恢復(fù)周一到周五的增量,我們且不說(shuō)周五下午6點(diǎn)到周六上午的數(shù)據(jù)不能被恢復(fù)。就是周一到周五能恢復(fù)的數(shù)據(jù)也要花費(fèi)大量的時(shí)間成本,在此期間應(yīng)用無(wú)法獲得正常數(shù)據(jù)的支撐,業(yè)務(wù)將會(huì)陷入癱瘓狀態(tài)。
3、不具備防破壞能力。
對(duì)于數(shù)據(jù)的破壞,我們?cè)谇懊娣殖闪俗匀黄茐?、軟破壞以及意外破壞。?duì)于自然破壞來(lái)說(shuō)一般采用異地備份的方式,但是對(duì)于軟破壞以及意外破壞傳統(tǒng)的備份方式卻很難解決。我們還是以周日做全備,周一到周六的每天下午6點(diǎn)做增量備份為例。假設(shè)當(dāng)前時(shí)間是在周五的,上午8點(diǎn)到下午4點(diǎn)期間往數(shù)據(jù)庫(kù)中錄入了2萬(wàn)條索引記錄,而在4點(diǎn)01分,這些數(shù)據(jù)因?yàn)橐粭lSQL語(yǔ)句寫(xiě)錯(cuò)被誤刪除。那么此時(shí)離當(dāng)前時(shí)間最近的是周四下午6點(diǎn)的恢復(fù)點(diǎn),那時(shí)候是還沒(méi)有這2萬(wàn)條數(shù)據(jù)的。這就意味著被誤刪的2萬(wàn)條數(shù)據(jù)將永久丟失。
而對(duì)于意外情況,如重啟所造成的數(shù)據(jù)缺失而導(dǎo)致數(shù)據(jù)庫(kù)置疑以及無(wú)法加載時(shí),也只能恢復(fù)到上一個(gè)恢復(fù)點(diǎn),而這個(gè)恢復(fù)點(diǎn)距離故障點(diǎn)有很大的時(shí)間窗口,這就導(dǎo)致了破壞無(wú)法被完全修復(fù)。
四、核電信息化數(shù)據(jù)可靠災(zāi)備的建設(shè)目標(biāo)
綜合核電領(lǐng)域信息化數(shù)據(jù)的特點(diǎn),在進(jìn)行容災(zāi)備份時(shí),需要重點(diǎn)實(shí)現(xiàn)以下建設(shè)目標(biāo):
1、各服務(wù)器上重要數(shù)據(jù)零丟失
對(duì)數(shù)據(jù)進(jìn)行自動(dòng)監(jiān)控,連續(xù)捕獲和備份數(shù)據(jù)變化,只要數(shù)據(jù)發(fā)生變化,便實(shí)時(shí)、準(zhǔn)確的備份下來(lái)。保證了數(shù)據(jù)的安全,一旦出現(xiàn)數(shù)據(jù)丟失或破壞,可以迅速的從備份機(jī)上把數(shù)據(jù)恢復(fù)回來(lái)。
2、災(zāi)難發(fā)生后進(jìn)行迅速接管和逆向同步
當(dāng)主服務(wù)器出現(xiàn)意外宕機(jī)時(shí),備份機(jī)可以在一分鐘之內(nèi)接管主服務(wù)器的IP,提供對(duì)外的所有服務(wù),保證了核心業(yè)務(wù)連續(xù)性,可以提供365天7*24小時(shí)的業(yè)務(wù)不間斷的保護(hù)。
災(zāi)難發(fā)生后,原有系統(tǒng)必須盡快恢復(fù)?;謴?fù)時(shí)執(zhí)行與數(shù)據(jù)容災(zāi)復(fù)制相反的過(guò)程,即從災(zāi)備中心逆向同步到主數(shù)據(jù)中心,同步完成即可做應(yīng)用切換,整個(gè)系統(tǒng)恢復(fù)到原有狀態(tài)。
3、數(shù)據(jù)可進(jìn)行任意時(shí)間數(shù)據(jù)恢復(fù)
可按任意操作步數(shù)或時(shí)間點(diǎn)進(jìn)行數(shù)據(jù)快速恢復(fù),回到數(shù)據(jù)庫(kù)的任何狀態(tài),從而能夠找回誤刪或者損壞前的數(shù)據(jù)。在恢復(fù)的過(guò)程中不但保證了數(shù)據(jù)的完整型,而且能保證事件的完整性。解決了數(shù)據(jù)邏輯錯(cuò)誤。
4、數(shù)據(jù)的異地容災(zāi)
響應(yīng)《核電文件檔案管理要求》,對(duì)重要數(shù)據(jù)進(jìn)行異地容災(zāi),異地的容災(zāi)場(chǎng)地和生產(chǎn)中心需要不在同一個(gè)電網(wǎng)、不在同一個(gè)江河流域、不在同一個(gè)地震帶,相隔300公里以上。
五、核電信息化數(shù)據(jù)可靠災(zāi)備的實(shí)現(xiàn)技術(shù)
對(duì)應(yīng)第四大點(diǎn)提出的建設(shè)目標(biāo),需要從以下幾點(diǎn)進(jìn)行實(shí)現(xiàn):
1、數(shù)據(jù)零丟失
由 于傳統(tǒng)的全備、增量、差異備份方式存在明顯的時(shí)間窗口,會(huì)導(dǎo)致數(shù)據(jù)的丟失,基于此需要采用一種連續(xù)的保護(hù)模式,即CDP(Continuous Data Protection,持續(xù)數(shù)據(jù)保護(hù))模式。但CDP的產(chǎn)品又分化成兩大類:一種產(chǎn)品仍舊采用定時(shí)備份的模式,只是備份的時(shí)間窗口變小了,由原來(lái)的一天做 一次增量備份變成一小時(shí)做一次甚至半小時(shí)做一次,人們將這種CDP產(chǎn)品稱為準(zhǔn)CDP(Near CDP);另一種被稱為真CDP(Ture CDP)的產(chǎn)品,可以完全消除備份窗口(在理想的硬件環(huán)境下),RPO(Recovery Point Object 恢復(fù)點(diǎn)目標(biāo))為零,也就是真正意義上的持續(xù)數(shù)據(jù)保護(hù)。核電的數(shù)據(jù)不能丟,就需要采用Ture CDP的備份技術(shù)。
2、業(yè)務(wù)連續(xù)
之 前提到應(yīng)用的是否正常取決于數(shù)據(jù)的是否正常。而對(duì)于全備、增量、差異等備份方式來(lái)說(shuō),數(shù)據(jù)的正常需要一個(gè)恢復(fù)的過(guò)程,很多情況下,這個(gè)過(guò)程是過(guò)長(zhǎng)的。這時(shí) 候就需要想辦法來(lái)縮短數(shù)據(jù)恢復(fù)的時(shí)間,就是縮短RTO(RecoveryTime Object 恢復(fù)時(shí)間目標(biāo))??s短RTO的有效方式就是實(shí)時(shí)恢復(fù),數(shù)據(jù)從主機(jī)備份到備份機(jī)后,隨時(shí)進(jìn)行恢復(fù),等待應(yīng)用對(duì)數(shù)據(jù)的調(diào)用,是一份最新、完整的Standby 數(shù)據(jù)。而不是出了問(wèn)題以后再進(jìn)行恢復(fù),那樣必然會(huì)導(dǎo)致RTO太長(zhǎng)。
3、有效解決軟破壞
很多人把實(shí)時(shí)備份和 CDP之間畫(huà)了等號(hào),這是兩個(gè)不一樣的概念。實(shí)時(shí)備份只是消除了備份窗口,有變化就備份。而據(jù)SNIA(Storage Networking Industry Association 全球網(wǎng)絡(luò)存儲(chǔ)工業(yè)協(xié)會(huì))的CDP特別關(guān)注小組在2011年發(fā)布的一份CDP研究文檔稱:“可以捕獲任意的數(shù)據(jù)變化,至少可以備份到另外一個(gè)地方(異地容 災(zāi)),可以恢復(fù)到任意時(shí)間點(diǎn)。只有全部滿足以上這三條要求的CDP產(chǎn)品才能稱為真CDP。依據(jù)這樣的標(biāo)準(zhǔn),復(fù)制類技術(shù)(同步以及異步鏡像等。因?yàn)殓R像只有 一份數(shù)據(jù),即使有回退點(diǎn)也是有限個(gè)點(diǎn)快照)、快照技術(shù)(指針快照以及分割鏡像快照等。因?yàn)榭煺沾嬖跁r(shí)間間隔,兩個(gè)快照之間的數(shù)據(jù)可能丟失。且快照頻繁讀取 操作系統(tǒng),在數(shù)據(jù)、文件、應(yīng)用和系統(tǒng)間缺乏嵌入式關(guān)聯(lián)。)以及任何有備份窗口的計(jì)劃備份都不屬于CDP產(chǎn)品。”
由此可見(jiàn),CDP一定能實(shí) 現(xiàn)RPO為零的實(shí)時(shí)備份,但是能實(shí)現(xiàn)實(shí)時(shí)備份的產(chǎn)品未必是CDP,因?yàn)樗^的實(shí)時(shí)備份產(chǎn)品也未必能實(shí)現(xiàn)恢復(fù)到任意時(shí)間點(diǎn)。而恢復(fù)到任意時(shí)間點(diǎn)是解決軟破壞 的唯一辦法。數(shù)據(jù)在什么時(shí)候被誤刪除、被篡改,是無(wú)法預(yù)知的,不可能實(shí)現(xiàn)在刪除、篡改之前做好一個(gè)恢復(fù)點(diǎn)。這就需要恢復(fù)點(diǎn)是任意的,這樣才能保證100% 的回到刪除或者篡改之前的狀態(tài)。因?yàn)槿我恻c(diǎn)里面必然含有了刪除或者篡改之前的恢復(fù)點(diǎn)。
而對(duì)于意外事件來(lái)說(shuō)任意時(shí)間點(diǎn)回退也是完美的解決辦法,數(shù)據(jù)出現(xiàn)缺失導(dǎo)致的數(shù)據(jù)庫(kù)置疑只需要通過(guò)恢復(fù)到最近的一個(gè)點(diǎn)就可即保證數(shù)據(jù)可用又保證數(shù)據(jù)最新。
4、無(wú)限增量降低災(zāi)備成本
異 地災(zāi)備最重要的資源就是網(wǎng)絡(luò)資源,傳輸帶寬太低達(dá)不到實(shí)時(shí)備份的效果,傳輸帶寬太高則成本太過(guò)昂貴。這就需要在異地災(zāi)備數(shù)據(jù)傳輸?shù)倪^(guò)程中采取最優(yōu)的方式, 降低單位時(shí)間內(nèi)的數(shù)據(jù)傳輸量。而對(duì)于CDP來(lái)說(shuō)是采用的無(wú)限增量傳輸模式是將隨時(shí)產(chǎn)生的數(shù)據(jù)實(shí)時(shí)傳輸出去,而不是在某一時(shí)間點(diǎn)再進(jìn)行集中傳輸,這樣就大大 降低了對(duì)網(wǎng)絡(luò)資源的占用,從而實(shí)現(xiàn)了低成本災(zāi)備。
綜上所述,要想實(shí)現(xiàn)核電數(shù)據(jù)的可靠性災(zāi)備需要滿足:防止數(shù)據(jù)丟失、防止業(yè)務(wù)停頓、防止數(shù)據(jù)破壞。立足這三點(diǎn)之上選擇合適的災(zāi)備產(chǎn)品,如北京和力記易科技有限公司的UPM備特佳容災(zāi)備份系統(tǒng)。就能將核電的數(shù)據(jù)立于銅墻鐵壁之內(nèi),萬(wàn)年無(wú)失!