當(dāng)發(fā)生支持業(yè)務(wù)的基礎(chǔ)架構(gòu)中斷時(shí)如何盡可能的保持業(yè)務(wù)服務(wù) 


    災(zāi)難發(fā)生時(shí)及時(shí)向客戶(hù)提供響應(yīng),維持公眾的信心
  
    滿(mǎn)足以下需求:
  
    稽核的審查
  
    標(biāo)準(zhǔn)/立法的要求
  
    保險(xiǎn)的要求
  
    安全
  
    許多的災(zāi)備方案被看成是一個(gè)技術(shù)的項(xiàng)目,僅僅有技術(shù)人員的介入,因此會(huì)造成項(xiàng)目實(shí)施后實(shí)際運(yùn)行的實(shí)效性差,因?yàn)槿鄙贅I(yè)務(wù)與科技人員的有序配合。業(yè)務(wù)層面的恢復(fù)流程沒(méi)有和科技技術(shù)層面的恢復(fù)流程集成。災(zāi)備方案的實(shí)施目的是在發(fā)生災(zāi)難的時(shí)候,業(yè)務(wù)可以盡快恢復(fù)運(yùn)行。因此一個(gè)成功的業(yè)務(wù)連續(xù)策略需要滿(mǎn)足重要業(yè)務(wù)流程的需求,需要業(yè)務(wù)及科技決策人的共同參與,需要超越傳統(tǒng)的備份/恢復(fù)及災(zāi)備計(jì)劃方案,將業(yè)務(wù)連續(xù)性計(jì)劃的制定視同為任何新系統(tǒng)的設(shè)計(jì)計(jì)劃的一部分,將其集成為IT變更管理流程的一部分,成為新應(yīng)用開(kāi)發(fā)中的一個(gè)必要的非功能性需求。
  
    因此一個(gè)業(yè)務(wù)連續(xù)性的工程啟動(dòng)要先成立業(yè)務(wù)連續(xù)性項(xiàng)目管理辦公室(BCPO)。其組成人員為:一位項(xiàng)目總監(jiān)、幾位項(xiàng)目經(jīng)理。BCPO核心成員應(yīng)成立一個(gè)永久性的部門(mén)以支持正在進(jìn)行的業(yè)務(wù)連續(xù)性工作,他們是:各主要業(yè)務(wù)部人員,應(yīng)用小組的代表,IT科技人員。BCPO負(fù)責(zé)開(kāi)發(fā)業(yè)務(wù)連續(xù)性規(guī)劃,包括以下內(nèi)容:
  
    業(yè)務(wù)連續(xù)性計(jì)劃的范疇定義
  
    工程的任務(wù)定義
  
    關(guān)鍵業(yè)務(wù)功能/關(guān)鍵應(yīng)用/業(yè)務(wù)影響分析
  
    災(zāi)難定義??制定什么是災(zāi)難,需要啟動(dòng)生產(chǎn)切換的準(zhǔn)則
  
    災(zāi)難的標(biāo)準(zhǔn)
  
    災(zāi)難的情景設(shè)定
  
    小組劃分及職責(zé)定義
  
    業(yè)務(wù)恢復(fù)管理者/管理小組
  
    關(guān)鍵經(jīng)理主管人員
  
    災(zāi)難評(píng)估小組
  
    對(duì)外媒體聯(lián)絡(luò)小組
  
    業(yè)務(wù)恢復(fù)小組
  
    技術(shù)恢復(fù)小組
  
    用戶(hù)確認(rèn)小組
  
    設(shè)施/設(shè)備恢復(fù)小組
  
    小組間交叉關(guān)系定義,發(fā)生災(zāi)難時(shí)詳細(xì)的聯(lián)絡(luò)計(jì)劃和機(jī)密資源需求流程
  
    電話及聯(lián)系信息


    內(nèi)容包括災(zāi)難預(yù)警、災(zāi)難恢復(fù)評(píng)估與決策、災(zāi)難恢復(fù)啟動(dòng)、災(zāi)難恢復(fù)的執(zhí)行和回退
  
    業(yè)務(wù)連續(xù)性計(jì)劃地維護(hù)、演習(xí)
  
    如何實(shí)施業(yè)務(wù)運(yùn)轉(zhuǎn)連續(xù)性,國(guó)內(nèi)的災(zāi)備備份模式
  
    因?yàn)橹袊?guó)國(guó)土的遼闊,各企業(yè)的災(zāi)備中心的拓?fù)渲贫ǜ鞑幌嗤?。?duì)于那些完成了數(shù)據(jù)中心(IT)集中整合的企業(yè),通常災(zāi)備中心的拓?fù)湓O(shè)計(jì)如下圖所示:
  
    在同城中建立熱接管的互備中心,接管的時(shí)間可以達(dá)到即時(shí),數(shù)據(jù)丟失為零,中心之間的距離在100公里以?xún)?nèi)。在此雙中心內(nèi),可以提供一個(gè)高可用系統(tǒng)的體系設(shè)計(jì),防范非區(qū)域性災(zāi)難的故障:如某些硬件的故障、區(qū)域性火災(zāi)等等。實(shí)質(zhì)上是實(shí)現(xiàn)了一個(gè)跨中心的高冗余系統(tǒng)設(shè)計(jì)。比如:如果系統(tǒng)的磁盤(pán)系統(tǒng)發(fā)生故障時(shí),無(wú)需啟動(dòng)災(zāi)備系統(tǒng),可以自動(dòng)熱切換到同城另一個(gè)新的磁盤(pán)系統(tǒng)上,業(yè)務(wù)繼續(xù)運(yùn)行。
  
    在跨城市、遠(yuǎn)距離之間的中心建立異步的災(zāi)難備份中心,以防范區(qū)域性災(zāi)難。此兩中心之間的距離可以是幾千公里以上,數(shù)據(jù)的復(fù)制技術(shù)是異步的,加上應(yīng)用系統(tǒng)層面的自動(dòng)化管理,系統(tǒng)的接管可以做到絕大部分的自動(dòng)化,減少人為的操作錯(cuò)誤,尤其是在災(zāi)難發(fā)生時(shí),無(wú)法保證了解系統(tǒng)的技術(shù)人員一定可以到現(xiàn)場(chǎng)進(jìn)行恢復(fù)操作。因此在災(zāi)備方案設(shè)計(jì)及實(shí)施中,是否可以做到極大化的系統(tǒng)操作自動(dòng)化是一個(gè)非常重要的考量方面。



  
    IBM服務(wù)部門(mén)有著豐富的災(zāi)備項(xiàng)目實(shí)施經(jīng)驗(yàn),以下是IBM服務(wù)部門(mén)建立業(yè)務(wù)連續(xù)性方案的方法論,起步于對(duì)企業(yè)所面臨的風(fēng)險(xiǎn)分析,風(fēng)險(xiǎn)對(duì)于業(yè)務(wù)可能帶來(lái)的影響分析,當(dāng)前現(xiàn)狀的分析,從而可以制定合理的業(yè)務(wù)恢復(fù)目標(biāo)及策略。在業(yè)務(wù)恢復(fù)的指標(biāo)中:RPO(數(shù)據(jù)丟失量,通常以秒計(jì)算)、RTO(系統(tǒng)恢復(fù)時(shí)間)、NTO(網(wǎng)絡(luò)恢復(fù)時(shí)間)及業(yè)務(wù)的恢復(fù)范圍(比如優(yōu)先恢復(fù)那些業(yè)務(wù)的服務(wù),以銀行為例:恢復(fù)柜面業(yè)務(wù)、POS、ATM業(yè)務(wù)等等)是最重要的指標(biāo),它是連接技術(shù)方案選型及業(yè)務(wù)服務(wù)恢復(fù)承諾目標(biāo)之間的關(guān)鍵可衡量的指標(biāo),并且決定性地影響著實(shí)施此方案的投資額度。



  
    任何一個(gè)工程的實(shí)施都不會(huì)是千篇一律的。在此僅列出一個(gè)災(zāi)備工程的高層面項(xiàng)目實(shí)施步驟。僅供參考。



  
    如何維護(hù)業(yè)務(wù)運(yùn)轉(zhuǎn)連續(xù)性
  
    完成了業(yè)務(wù)連續(xù)性方案的實(shí)施,并不意味著業(yè)務(wù)連續(xù)性計(jì)劃將保持一成不變。如果業(yè)務(wù)連續(xù)性計(jì)劃被束之高閣,一旦啟動(dòng),我們無(wú)從知曉災(zāi)備方案是否可以達(dá)到預(yù)期的戰(zhàn)略及戰(zhàn)術(shù)效果。隨著新的市場(chǎng),新的行業(yè)規(guī)則的出現(xiàn);技術(shù)的革新,新的認(rèn)證標(biāo)準(zhǔn)及新的業(yè)務(wù)模式的出現(xiàn);公司經(jīng)營(yíng)方針、目標(biāo)的改變,公司的重組及收購(gòu);新的法律條款的出現(xiàn);在不斷的實(shí)踐中方案可能逐步暴露出其缺陷、弱點(diǎn);以上所有的情形均要求對(duì)災(zāi)備方案進(jìn)行不停的維護(hù)、測(cè)試及演練。制定常規(guī)的災(zāi)備恢復(fù)演練計(jì)劃是非常必要的。演練的頻率、范圍均因企業(yè)的不同而不同。一般在銀行界,一年至少進(jìn)行一次全面的業(yè)務(wù)層面的演練,數(shù)次系統(tǒng)層面、網(wǎng)絡(luò)層面及應(yīng)用層面的演練,以確?;謴?fù)流程的時(shí)效性、實(shí)效性和可行性,以及技術(shù)方案的正確性。
  
    建立業(yè)務(wù)的韌性(resilience )— 災(zāi)難備份概念的拓展
  
    隨時(shí)隨地的面對(duì)著諸多的非區(qū)域性自然災(zāi)難的不安全生產(chǎn)因素的困擾,我們?cè)趺崔k來(lái)確保企業(yè)的安全運(yùn)營(yíng)?這就是為什么當(dāng)前業(yè)界引入業(yè)務(wù)的韌性(Resilience)的觀念及解決方案。
  
    IBM確定了對(duì)于建立成功的業(yè)務(wù)韌性策略的六條必要的基本規(guī)則:
  
    整合的風(fēng)險(xiǎn)管理:這里突出的是“整合”。沒(méi)有一個(gè)全面的對(duì)業(yè)務(wù)風(fēng)險(xiǎn)的了解,則無(wú)法準(zhǔn)備好來(lái)應(yīng)對(duì)可能出現(xiàn)的問(wèn)題。找出業(yè)務(wù)運(yùn)營(yíng)中的風(fēng)險(xiǎn)并運(yùn)用相關(guān)技術(shù)對(duì)其進(jìn)行認(rèn)知,響應(yīng)和管理。
  
    業(yè)務(wù)運(yùn)轉(zhuǎn)的連續(xù)性:這就是我們常常說(shuō)的運(yùn)用從業(yè)務(wù)級(jí)到IT的災(zāi)備方案來(lái)提供業(yè)務(wù)的連續(xù)運(yùn)轉(zhuǎn)的能力。當(dāng)發(fā)生宕機(jī)事故時(shí),如何通過(guò)流程,即及時(shí)響應(yīng)的、高可用的、高可擴(kuò)展的系統(tǒng)基礎(chǔ)架構(gòu)來(lái)維持業(yè)務(wù)系統(tǒng)的持續(xù)性運(yùn)轉(zhuǎn)。
  
    規(guī)章制度的服從:當(dāng)中國(guó)加入世貿(mào)組織時(shí),企業(yè)除了要了解國(guó)內(nèi)業(yè)界監(jiān)管機(jī)制的政策、策略、制度的要求外,還要充分認(rèn)知世界范圍業(yè)界的規(guī)章制度,服從現(xiàn)有政府和業(yè)界的規(guī)章制度和標(biāo)準(zhǔn),特別是有關(guān)信息的完整性和可用性方面。
  
    安全、隱私和數(shù)據(jù)保護(hù):通過(guò)正確的策略、方法、工具以及統(tǒng)一的監(jiān)管來(lái)確保數(shù)據(jù)、信息、系統(tǒng)以及人員的安全性和隱私性。
  
    知識(shí)、專(zhuān)業(yè)和技能:為確保業(yè)務(wù)運(yùn)行具有相應(yīng)的韌性,則必須確??梢栽谡_的時(shí)間和地點(diǎn)具有恰當(dāng)?shù)娜肆Y源。僅僅建設(shè)一些基礎(chǔ)結(jié)構(gòu)來(lái)實(shí)施災(zāi)備,而不配和人力資源的恢復(fù)計(jì)劃,則依然無(wú)法提供業(yè)務(wù)的連續(xù)運(yùn)轉(zhuǎn)。
  
    應(yīng)對(duì)市場(chǎng)的動(dòng)態(tài)變化:提高對(duì)快速變化的客戶(hù)需求和新的市場(chǎng)機(jī)遇的敏感程度以及響應(yīng)速度。建立具有彈性的基礎(chǔ)架構(gòu)體系,以響應(yīng)動(dòng)態(tài)及快速的市場(chǎng)要求。
  
    風(fēng)險(xiǎn)管理是一個(gè)具有恢復(fù)能力企業(yè)的重要基礎(chǔ)組成部分之一。對(duì)于那些已經(jīng)認(rèn)識(shí)到并實(shí)施了災(zāi)難備份方案的企業(yè),是時(shí)機(jī)進(jìn)行全面業(yè)務(wù)韌性的建設(shè)了。業(yè)務(wù)的可恢復(fù)性整合了IT的可恢復(fù)性、高可用性、業(yè)務(wù)連續(xù)性以及信息安全項(xiàng)目,它同時(shí)也解決了管理,特別是規(guī)章制度的服從方面的問(wèn)題。
  
    IBM認(rèn)為:通過(guò)具韌性的、靈活的基礎(chǔ)架構(gòu)支撐的具有恢復(fù)能力的業(yè)務(wù)系統(tǒng),可以幫助企業(yè)的業(yè)務(wù)系統(tǒng)適應(yīng)各種破壞以及災(zāi)難所帶來(lái)的挑戰(zhàn),同時(shí)能實(shí)時(shí)響應(yīng)新機(jī)遇和新變化,從而確保企業(yè)業(yè)務(wù)的持續(xù)運(yùn)轉(zhuǎn)。
  

分享到

多易

相關(guān)推薦