一、項目概況作為中國聯(lián)通省級單位,本次的容災工程涉及到云南聯(lián)通的綜合營帳系統(tǒng)、短消息計費等系統(tǒng),它們分別運行在不同的操作系統(tǒng)平臺上,其數(shù)據也分布在不同的存儲設備上。業(yè)務系統(tǒng)已投入生產使用,所以,在整個工程實施過程中減小對運行業(yè)務的影響是重中之重。
在容災系統(tǒng)一期工程中,神州數(shù)碼幫助云南聯(lián)通完成了數(shù)據遷移,將原來分布在多個存儲設備上的綜合營業(yè)系統(tǒng)、綜合帳務系統(tǒng)、短信計費系統(tǒng)、繳費卡系統(tǒng)的數(shù)據遷移到新購買的存儲設備上,并且將各業(yè)務系統(tǒng)數(shù)據實時復制到容災中心存儲設備上,實現(xiàn)云南聯(lián)通生產系統(tǒng)的數(shù)據容災。在一期工程中,容災中心沒有配備主機,如果生產中心發(fā)生嚴重災難時,容災中心不能接管業(yè)務。因此,神州數(shù)碼又幫助云南聯(lián)通開展了二期工程,逐步從數(shù)據級容災過渡到應用級容災。
除此之外,還建立了良好的運行管理制度,建立完善的容災切換與恢復流程,保證在發(fā)生嚴重災難時各業(yè)務系統(tǒng)得到及時有效的恢復。
二、用戶需求分析
相比起其他工程來說,云南聯(lián)通容災一期工程不是簡單的存儲擴容和升級,而是包含了幾個子系統(tǒng)的移植和割接,實施難度大、復雜程度高。工作量相當驚人,首先因為是省級數(shù)據大集中的模式,所涉及的數(shù)據量大;其次所涉及的硬件設備紛繁多樣;其三操作系統(tǒng)各不相同;其四數(shù)據庫版本高低不一;其五應用系統(tǒng)五花八門。在如此復雜的環(huán)境中要求數(shù)據移植必須分毫不差,而且每個系統(tǒng)的割接都必須在當天晚上完成,絕對不能影響聯(lián)通第二天的正常營業(yè)。
而二期工程則逐步過渡到應用級容災;在災難發(fā)生時,保障系統(tǒng)及數(shù)據的安全。主要考慮使營業(yè)、帳務系統(tǒng)在生產中心發(fā)生災難時能夠盡快地切換到容災中心,使這兩個系統(tǒng)的應用能夠盡快恢復,從而使云南聯(lián)通充分保障客戶正常使用業(yè)務的權利和維護良好的企業(yè)形象。
三、如何滿足需求
1、數(shù)據級容災
按照規(guī)劃,神州數(shù)碼在首期工程中建設同城災備中心,主要工作是硬件平臺搭建、數(shù)據遷移、測試演習等工作。其中最重要也是難度最大的就是數(shù)據遷移,將原來分布在多個存儲設備上的數(shù)據遷移到新購買的存儲設備上來。包括綜合營業(yè)系統(tǒng)、綜合帳務系統(tǒng)、短信計費系統(tǒng)、繳費卡系統(tǒng)的數(shù)據遷移工作。
這個階段在整個項目實施過程中具有里程碑的意義,并且由于這幾個系統(tǒng)都是實時生產系統(tǒng),保證數(shù)據在遷移過程中的完整性、一致性和保證業(yè)務系統(tǒng)在停機遷移后仍能正常工作是本次遷移的重點,也帶來了極大的風險和難度。
為保障應用系統(tǒng)遷移的成功,神州數(shù)碼公司在著手實施前做了大量的調研、實驗工作以確認實施方案的可行性,制定了遷移的規(guī)劃和具體操作步驟。在規(guī)劃中包含了詳細的時間安排、操作步驟、風險分析與應急方案。在與用戶進行詳細的討論后,按不同系統(tǒng),分4次進行了移植,保證了在計劃內的按時營業(yè)。
在完成數(shù)據遷移后,神州數(shù)碼又幫助用戶建立了同城災備中心,采用基于智能存儲系統(tǒng)的同步數(shù)據復制技術,對綜合營帳、綜合結算、綜合客服系統(tǒng)的重要數(shù)據進行同步復制,實現(xiàn)了數(shù)據級的容災備份,使云南聯(lián)通用戶的數(shù)據安全性有了強大的保障。
2、應用級容災
但僅有數(shù)據備份是完全不夠的,要滿足所有支撐系統(tǒng)的需求,所以,在二期建設中,我們的目標就是逐步過渡到應用級容災。此外,災難管理維護機構設置和人員組織、管理維護制度和操作規(guī)程的制定等也必須形成一個完整的體系。
在應用級容災上,工作的重點有兩個:一是在發(fā)生災難的時候,業(yè)務如何進行接管;二是如何將數(shù)據實時同步到容災中心以及如何為報表系統(tǒng)使用?為了解決業(yè)務接管問題,保證業(yè)務的連續(xù)性,必須在備份中心放置業(yè)務主機,同時還需要建立良好的運行管理制度,建立完善的容災切換與恢復流程,這樣才能保證在發(fā)生各種災難時各業(yè)務系統(tǒng)得到及時有效的恢復。
客戶的對容災中心的建設投資很大,但是平時基本處于空閑狀態(tài),為了最大限度地保護用戶的投資,我們充分挖掘備份中心的功能,使其在平時能夠得到充分的利用。
如在數(shù)據的充分使用方面,我們在云南聯(lián)通的業(yè)務支撐系統(tǒng)的運營中發(fā)現(xiàn)在月末的集中時段出報表時,對系統(tǒng)(包括主機和磁盤陣列)處理的壓力非常大。因此,在二期建設時,我們通過數(shù)據拷貝功能,在容災中心建立帳務系統(tǒng)報表處理系統(tǒng),充分了利用容災系統(tǒng)數(shù)據,同時緩解了主用系統(tǒng)處理壓力。
又如在容災中心建立測試、開發(fā)系統(tǒng),這樣既改善了原來的測試環(huán)境,同時也充分發(fā)揮了備份中心主機和存儲的作用。
3、豐富的層次結構
一期建設完畢后,云南聯(lián)通已采用HP CA軟件實現(xiàn)了數(shù)據從生產中心到容災中心的復制,根據二期的要求,云南聯(lián)通選擇采用HP即使用HP的Business Copy軟件,在容災中心,定期將營帳的數(shù)據復制出來,由查詢系統(tǒng)使用。示意圖如下:
4、成功的關鍵
容災是一個復雜的系統(tǒng)工程,而不僅僅是容災產品和技術的簡單安裝。因此,除卻技術因素外,項目的執(zhí)行力、管理能力成為成功實施的關鍵。為了幫助客戶建立一個安全、有效的容災系統(tǒng),神州數(shù)碼推出了容災工程服務體系,從系統(tǒng)咨詢規(guī)劃、系統(tǒng)建設直至系統(tǒng)運行維護的一個完整的服務體系。
據了解,根據云南聯(lián)通的容災工程的要求,神州數(shù)碼提供的服務包含下列內容:
四、項目評價
容災一期建設經歷了過系統(tǒng)安裝、調試達到技術規(guī)范書規(guī)定的指標后,云南聯(lián)通即與神州數(shù)碼一起按照驗收標準對整個系統(tǒng)進行驗收,保證系統(tǒng)平臺的安裝實施達到設計目標。
云南聯(lián)通容災工程的順利實施,使其容災備份系統(tǒng)逐步過渡到應用級容災;在災難發(fā)生時,保障系統(tǒng)及數(shù)據的安全,營業(yè)、帳務系統(tǒng)在生產中心發(fā)生災難時能夠盡快地切換到容災中心,充分保障客戶正常使用業(yè)務的權利和維護良好的企業(yè)形象。