日常生活中,我們經(jīng)常看到各種類型的演習:防火、防洪及救治演習,即使在和平年代,也經(jīng)常進行軍事演習。演習的好處頗多,能夠預(yù)演災(zāi)難發(fā)生后的應(yīng)對方案。
今年3月,在寧波世貿(mào)大樓發(fā)生了一場相當大的火災(zāi),調(diào)動了10個消防中隊、22輛消防車進行撲救,而整座大樓里的近萬人在20分鐘內(nèi)被成功疏散,未造成人員傷亡。這是一個奇跡??這么大的火,又是在鬧市區(qū),來得如此突然,然而竟無一人傷亡,這一奇跡是怎么創(chuàng)造的?應(yīng)該歸功于平時的消防演習。
所以,對于用戶重金構(gòu)建的容災(zāi)解決方案,是不是也應(yīng)該經(jīng)常進行演習呢?答案當然是肯定的,事實上,無論用戶采用了多么先進的容災(zāi)解決方案,都無法確保在災(zāi)難發(fā)生時的萬無一失。因為無論當初的容災(zāi)方案設(shè)計得多么周密,在災(zāi)難發(fā)生時都會有些地方考慮不到。演習的好處就在于能及時發(fā)現(xiàn)并排除隱患。業(yè)界在災(zāi)難恢復(fù)演習方面提供了豐富的方案。比如,在大型機系統(tǒng)中,一般需要三套系統(tǒng)來保障業(yè)務(wù)運行,其中一套就是用來演習、測試使用的。為什么不能使用第二套來承擔演習任務(wù)呢?原因在于第二套系統(tǒng)時刻作為主系統(tǒng)的備份系統(tǒng),如果演習過程中發(fā)生一些故障,而此時主系統(tǒng)同時發(fā)生故障,那么就會造成災(zāi)難。NetApp的FlexClone軟件提供了一種在線Clone(克隆)技術(shù),它幾乎不多占用另外的空間便能夠生成額外的Clone,用戶可以使用Clone數(shù)據(jù)進行災(zāi)難恢復(fù)演習。此外,賽門鐵克的Veritas Cluster Server軟件中包括災(zāi)難襲擊之前進行準備、規(guī)劃和測試的工具,可以幫助用戶進行災(zāi)難恢復(fù)演習。
在與用戶交流過程中,有用戶反映,盡管他們意識到了演習的必要性,但是,實際使用的運營系統(tǒng)使得他們根本不敢進行演習。他們認為,在三種級別的容災(zāi)系統(tǒng)(數(shù)據(jù)級、設(shè)備級和系統(tǒng)級)中,只有系統(tǒng)級的容災(zāi)方案才可以進行災(zāi)難恢復(fù)演習嘗試,而對于大多數(shù)用戶來說,往往都不具備昂貴的系統(tǒng)級容災(zāi)方案,因此無法進行演習。
然而事實并非如此,系統(tǒng)級的容災(zāi)方案進行的是在線的災(zāi)難恢復(fù)演習,而即使是數(shù)據(jù)級和設(shè)備級的容災(zāi)方案,仍然可以進行相應(yīng)程度的災(zāi)難恢復(fù)演習。比如,設(shè)想在線的設(shè)備發(fā)生故障,其中的數(shù)據(jù)全部丟失,用戶可以演習如何將備份的數(shù)據(jù)恢復(fù)到其他位置。而按照某調(diào)查機構(gòu)的統(tǒng)計,在使用磁帶系統(tǒng)恢復(fù)備份數(shù)據(jù)時,不能夠完全成功恢復(fù)的比率超過80%。
由此可見,災(zāi)難恢復(fù)演習適用于每個用戶,只有敢于演習、經(jīng)常演習,才能夠降低數(shù)據(jù)丟失的風險。