上海市電力公司借鑒EMC BCSI,并廣泛學習國際災難恢復協(xié)會(DRII)《Professional Practices for Business Continuity Planners》、國務院信息辦《重要信息系統(tǒng)災難恢復規(guī)劃指南》、《國家電網(wǎng)公司信息系統(tǒng)應急預案》等指導性文件,對自己的業(yè)務情況進行了全面的風險分析、業(yè)務影響分析、IT系統(tǒng)現(xiàn)狀分析,最終制定出上海市電力公司的業(yè)務連續(xù)性策略,寫出了長達75頁的《業(yè)務連續(xù)性策略報告》,作為整個項目實施的指南。

關(guān)鍵二:先進的技術(shù)平臺

根據(jù)《策略報告》,上海市電力在浦東和浦西分別設立數(shù)據(jù)中心,實現(xiàn)同城異地的數(shù)據(jù)應急容災。上海市電力在主、備數(shù)據(jù)中心選擇了統(tǒng)一的IBM P570主機設備,主數(shù)據(jù)中心選用2臺EMC DMX-3存儲陣列作為主中心CIS、PMS、ERP應用系統(tǒng)存儲設備,其中1臺為CIS專用設備,另1臺為ERP、PMS共用。原CIS數(shù)據(jù)倉庫采用了EMC DMX2000存儲系統(tǒng),本次將數(shù)據(jù)倉庫應用遷移到DMX-3以后,DMX2000便作為應急系統(tǒng)備份中心CIS、PMS、ERP應用系統(tǒng)存儲設備。主、備中心之間采用DWDM設備通過2條不同方向的光纖實現(xiàn)兩地SAN的高速級聯(lián),進行存儲陣列2對1數(shù)據(jù)復制。在數(shù)據(jù)管理方面,用到EMC的三個重要軟件:EMC SRDF異地復制軟件、EMC TimeFinder本地復制軟件和EMC Control Center管理軟件,實現(xiàn)浦東數(shù)據(jù)中心和浦西數(shù)據(jù)中心之間的數(shù)據(jù)復制。

通過以上平臺,可以確保生產(chǎn)系統(tǒng)和備份系統(tǒng)的數(shù)據(jù)完全一致,可以透明地切換業(yè)務。換句話講,用戶無需任何專門的停機時間,即可完成業(yè)務的啟動,真正實現(xiàn)用戶業(yè)務系統(tǒng)的連續(xù)性。用戶可以利用該功能,非常輕松地實現(xiàn)應急演練和日常計劃性停機維護等工作。

結(jié)合本地數(shù)據(jù)復制軟件EMC TimeFinder,上海市電力可以克隆生產(chǎn)數(shù)據(jù)或?qū)ιa(chǎn)數(shù)據(jù)執(zhí)行快照,或者用于數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)挖掘和抽樣等,還可以在災備端對災備磁盤執(zhí)行同樣的功能,克隆數(shù)據(jù)可以作為應急演練的環(huán)境??煺諗?shù)據(jù)可以在鏈路中斷等故障、需要數(shù)據(jù)再同步時,對災備數(shù)據(jù)實現(xiàn)二次保護。

關(guān)鍵三:防患于未然的演練

正如上海市電力公司副總經(jīng)理阮前途在驗收會上所說,"某種意義上講,安全的最大隱患是對安全的估計不足。信息系統(tǒng)尤其是電力部門的信息系統(tǒng),要把它提高到電網(wǎng)安全層面上來考慮。真正發(fā)生事故的時候,專家們并不在場,緊急狀況下還有可能出現(xiàn)其他的突發(fā)事件。所以今后這方面的演練我們要經(jīng)常做,信息系統(tǒng)也要像電網(wǎng)事故的演練一樣要經(jīng)常進行。不可能靠事故的發(fā)生來積累經(jīng)驗,只能通過不斷地演練來積累自己的經(jīng)驗。同時,需要充分借鑒其他行業(yè)的經(jīng)驗。"

在10月25日的演練中,模擬場景是:浦東數(shù)據(jù)中心的ERP系統(tǒng)出現(xiàn)嚴重故障,預計4小時內(nèi)難以恢復。于是立即采取措施,啟動浦西數(shù)據(jù)中心的應急系統(tǒng),ERP、CIS、PMS三大應用系統(tǒng)切換到浦西數(shù)據(jù)中心。從應用處理到主機處理、存儲處理,切換順利完成,接著就是最為緊張的業(yè)務切回和數(shù)據(jù)恢復,由于整套系統(tǒng)遵循EMC的BCSI方法論進行了全套流程的規(guī)范和完善,一系列步驟快而不亂,不知不覺,主機恢復、應用恢復、接口恢復、應用內(nèi)部測試、DNS修改、業(yè)務測試一氣呵成,演練成功完成。

由于整個技術(shù)平臺設計先進、科學、合理,使得演練過程對正常業(yè)務開展幾乎沒有影響,演練也得以經(jīng)常進行。

據(jù)上海市電力公司科技信息部評價,總體來說,整個應急系統(tǒng)的建設是成功的。上海市電力數(shù)據(jù)中心應急系統(tǒng)實施后的效果與前期做的總體設計及BCP計劃完全一致,也就是說主中心在出現(xiàn)主機故障、網(wǎng)絡故障、甚至火災情況下,公司業(yè)務中斷時間可以控制在2小時之內(nèi),可以保證數(shù)據(jù)零丟失,RTO、RPO指標完全滿足業(yè)務連續(xù)性需求,同時可有效提高一定區(qū)域內(nèi)災難(如地理災害、電力故障、故意破壞等)的應對能力。

整個項目的成功實施充分體現(xiàn)了上海市電力的執(zhí)行能力,EMC公司的方法論和技術(shù)解決方案也經(jīng)受住考驗。項目相關(guān)各方通過幾個月的努力,基于成熟的方法論、先進的技術(shù)平臺、經(jīng)常的演練,對異外故障作好了充分的準備,為我國的關(guān)鍵業(yè)務應用樹立了又一個成功的信息化案例。

用戶資料:

上海市電力公司一直很重視信息化建設,作為華東地區(qū)的電力龍頭企業(yè),上海市電力管轄的上海市電網(wǎng)位于長江三角洲的東南前緣,供電營業(yè)區(qū)覆蓋整個上海市行政區(qū),到2005年底,全網(wǎng)發(fā)電裝機容量為1317.53萬千瓦,35-500千伏變電站642座,變電容量6940.72萬千伏安,年發(fā)電量728.45億千瓦時,年售電量704.62億千瓦時。為適應龐大的企業(yè)規(guī)模和迅猛的業(yè)務發(fā)展,上海市電力陸續(xù)部署了電力營銷管理系統(tǒng)、ERP系統(tǒng),實現(xiàn)了核心業(yè)務的信息化。

分享到

susan

相關(guān)推薦