全球經(jīng)濟一體化的今天,信息系統(tǒng)越來越成為社會生產能力的樞紐和重要支柱,人們忽然發(fā)現(xiàn),今天,信息系統(tǒng)的安全竟然能夠成為決定我們生死存亡的核心棋子,我們再也不能在常規(guī)意義上來看待這具有舉足輕重地位的“大腦”。我們四路環(huán)望,信息經(jīng)濟包圍了我們,也產生了巨大的噴薄欲出的新的發(fā)展動力。政府開始朝向服務型方向演變,電子政務系統(tǒng)越來越成為政府和百姓的連接橋梁,其作用比肩“血管”。電信領域日新月異的新一代網(wǎng)絡技術的飛躍,無一不構建在信息系統(tǒng)的的巨手支撐之中。能源系統(tǒng)的發(fā)展,已經(jīng)完全依賴于信息管理系統(tǒng)所構建的“主動脈”。多年以來,人們在認識到信息化社會的典型特征的同時,逐漸在多種程度上開始對于信息技術的安全問題加大投入,施以重墨。數(shù)據(jù)備份技術的發(fā)展,從無到有,從小到大,成為各企業(yè)信息系統(tǒng)的一門必修課。但是,“21世紀的珍珠港事件”的爆發(fā),曾給世界經(jīng)濟帶來了極大的負面影響,也使得越來越多的人們對于各業(yè)務運行的災難抗御能力提出了反思,人們發(fā)現(xiàn),天堂與地獄僅一墻之隔??梢哉f,“備份”已經(jīng)成為眾多信息系統(tǒng)的基本信息保護方式,而“容災”的概念在今天月來越顯得萬分醒目。
當企業(yè)因為信息化帶來快捷的服務決策和方便管理時,也必須面對著數(shù)據(jù)丟失的危險,數(shù)據(jù)大集中也會聚集風險,這是人們意識到的一點。數(shù)據(jù)的丟失會中斷企業(yè)正常的業(yè)務運行,造成巨大的經(jīng)濟損失。
當今天的人們在高談容災和業(yè)務連續(xù)性,在議論備份系統(tǒng)的選與見時,人們忽然發(fā)現(xiàn)了一個令他們困惑的謎團,這就是,所有的災難我們都能防御嗎?所有的災難我們都能快速恢復嗎?
容災和備份,首先要清楚容什么樣的災,其次要清楚災難后如何恢復,采用何種技術和管理手段確保信息系統(tǒng)能夠在系統(tǒng)之后的快速再建、數(shù)據(jù)如何利用后援手段確保最小程度的丟失。根據(jù)國務院信息辦今年頒布的《重要信息系統(tǒng)災難恢復指南>中所述定義,災難指由于人為或自然的原因,造成信息系統(tǒng)運行嚴重故障或癱瘓,使信息系統(tǒng)支持的業(yè)務功能停頓或服務水平不可接受、達到特定的時間的突發(fā)性事件。災難恢復指為了將信息系統(tǒng)從災難造成的故障或癱瘓狀態(tài)恢復到可正常運行狀態(tài)、并將其支持的業(yè)務功能從災難造成的不正常狀態(tài)恢復到可接受狀態(tài),而設計的活動和流程。
具體來說,我們可以將常規(guī)的業(yè)務系統(tǒng)故障風險分為幾大類:
人們經(jīng)過認真分析發(fā)現(xiàn),常規(guī)的容災系統(tǒng)具有保持業(yè)務在上述1-4類風險下的業(yè)務恢復能力,而第五類的人為錯誤只能依靠備份系統(tǒng)來恢復,但這類故障確是各類故障中發(fā)生頻率最高的。
亂花漸入迷人眼。人們發(fā)現(xiàn),一個美好的災難備份系統(tǒng)建設的愿望,在實踐中往往是那么的過程繁雜,抉擇難斷。容災系統(tǒng)固然可以通過各種復制手段解決大多數(shù)類型的故障的業(yè)務快速恢復問題,但是建立容災系統(tǒng)的成本是相當高昂的,而且人們仍然要面對最易發(fā)生的人為故障無法醫(yī)治的難點。過去,只能采用常規(guī)的備份系統(tǒng)。數(shù)據(jù)備份系統(tǒng),是指為防止系統(tǒng)出現(xiàn)操作失誤或系統(tǒng)故障導致數(shù)據(jù)丟失,而將數(shù)據(jù)集合從應用系統(tǒng)中以備份格式到處到離線的存儲介質的過程,在數(shù)據(jù)備份過程中,一般采用備份軟件和磁帶庫的物理介質保存系統(tǒng)配合來進行。 而常規(guī)的備份系統(tǒng)實際上采用的是粗放型的備份策略,如按照日月年等策略進行的各種全備份和增量備份,以及輔助進行的合成備份等(由于備份設備的制約和容量的限制,精細化的備份是不現(xiàn)實的)。在一般的備份系統(tǒng)中,常見的是每天一次,也就是對于數(shù)據(jù)的實時性或近實時性并不提供保證,而且,備份出來的格式是專用的備份格式,并非應用系統(tǒng)中的數(shù)據(jù)原有格局,恢復時一定要通過格式轉換進行倒回操作,因此也并不保證恢復的快捷和精細化的時間點恢復。舉例來說,一旦系統(tǒng)存放了1TB的數(shù)據(jù),并且按照日增量進行備份,一旦當日中午11:00發(fā)生意外,需要全數(shù)據(jù)的恢復,那么我們只能恢復到上一個恢復點(如昨日23:00),而且,恢復的用時可能會在5小時以上,這還要取決于增量備份的份數(shù)。這樣的恢復能力,遠遠滿足不了用戶越來越高的安全要求和服務要求,需要有一個契機和一個新的技術的誕生,來達到以用戶為中心的數(shù)據(jù)安全和系統(tǒng)安全的要求。
在容災體系中,人們往往采用RPO(災難是的數(shù)據(jù)保存點)和RTO(災難后的業(yè)務恢復點)這兩個指標來衡量容災體系的應急能力和系統(tǒng)保護能力。一般而言,容災系統(tǒng)確保RPO指標的基本要求(也就是僅僅考慮數(shù)據(jù)要保存到接近故障點)以及一些系統(tǒng)更高的RTO指標的要求,也就是災難時要考慮業(yè)務的處理系統(tǒng)的快速恢復能力。由于一般容災系統(tǒng)采用的復制技術的局限,往往在數(shù)據(jù)庫等業(yè)務恢復時,遇到一致性要求的數(shù)據(jù)回滾問題,這往往會使得應用的啟動會耗費一定的時間(RTO無法達標)。而能夠解決人工故障恢復問題的傳統(tǒng)備份技術,RPO指標和RTO指標都遠遠無法達到容災的要求,因為備份技術誕生時的業(yè)務連續(xù)性要求今天已發(fā)生了根本性的改變。設想一下,恢復到上一個備份日以及數(shù)小時的恢復周期,這已經(jīng)落后于以信息為動脈的現(xiàn)代信息社會的要求。
實際上,現(xiàn)在已經(jīng)產生了連續(xù)數(shù)據(jù)復制保護和多點影像保護的技術,這就是CDP的數(shù)據(jù)連續(xù)性保護技術,這一技術的出現(xiàn),真正使得數(shù)據(jù)的點備份變成了連續(xù)跟蹤數(shù)據(jù)變化的多點精細跟蹤技術,使得傳統(tǒng)意義的備份系統(tǒng)已經(jīng)淡化,而快速恢復以及任意時間點恢復已經(jīng)成為現(xiàn)實。
CDP 技術的先行者以美國飛康虛擬存儲公司的CDP架構為代表,具體實現(xiàn)的機理是:首先利用連續(xù)或間隔型的復制策略,實現(xiàn)用戶系統(tǒng)內的包括系統(tǒng)數(shù)據(jù)在內的數(shù)據(jù)連續(xù)復制(即可以支持到本地的復制,也可以同時進行到異地的復制),以確保災害發(fā)生時,數(shù)據(jù)恢復到最新的時間點,同時,采用配合復制的時間點快照技術(如TimeMark),連續(xù)產生多個時間點固定影像(可以按照每小時的間隔或分鐘的間隔),這些影像不僅時間精細化,而且是直接可用的image,人們無需進行任何改造,直接mount即可使用。大量的漸進性故障,如病毒的侵襲、人工的誤操作、軟件的BUG等等發(fā)生時,人們大可不必驚慌,因為你所做的只需要找到系統(tǒng)中存留的影像(如幾分鐘前的),進行簡單的空間重新定位(不到一分鐘),你就會愉快地看到被破壞的數(shù)據(jù)又重現(xiàn)光明,災難壓力化解于無形。當然,你還可以利用這些數(shù)據(jù)的多點連續(xù)快照,進行任何的開發(fā)和挖掘工作,數(shù)據(jù)的價值得到充分利用和增值。
我們再看一下,試想,系統(tǒng)完全損壞后(包括硬盤),幾分鐘內,系統(tǒng)又通過遠程引導和恢復了起來,這在傳統(tǒng)的恢復技術中是不可想象的,飛康的CDP構架(內部的disksafe組件)實現(xiàn)了,通過虛擬化存儲技術,存儲服務的多項難點被突破,人們的多個夢想被實現(xiàn),這實在是人們辦公、生產時的福音。CDP技術的出現(xiàn),真正意義使得數(shù)據(jù)復制和備份具有了高性能的RPO和RTO的能力,克服漸進式的災難具有了殺手锏。這一技術將在不遠的將來對于容災技術和備份技術的架構產生又一次修正。
美國飛康軟件公司的CDP架構具有以下的一些特點:
目前,CDP 技術也成為了其他一些存儲廠商所關注的焦點,一些傳統(tǒng)的存儲備份技術也在悄悄地發(fā)生著變化,融入CDP的數(shù)據(jù)多點快速恢復的元素。對于用戶而言,CDP技術完全是應用的要求、是信息化的要求、是服務水準的要求,CDP 技術帶來的無窮價值毋庸多言,用戶從中受到的益處是十分巨大的。越來越多的人在感受著這一點,這也是存儲技術發(fā)展的技術結晶。
總之,建立強大的災難抵御系統(tǒng),需要我們善于理性分析、跟蹤存儲技術的脈搏,與時俱進。撥開迷霧,康莊之路在眼前。緊跟存儲脈搏,成功不再遙遠。