雞蛋要不要放在一個籃子里?
信息化發(fā)展到今天,數(shù)據(jù)的大集中、數(shù)據(jù)價值的實現(xiàn)已經(jīng)是信息化系統(tǒng)的主要作用之一。在數(shù)據(jù)大集中的基礎上,我們?nèi)粘5纳a(chǎn)生活也越來越依賴信息系統(tǒng)上承載的豐富多樣的應用。用一個形象的比喻,我們把越來越多的關(guān)鍵數(shù)據(jù)、關(guān)鍵應用放在了一個籃子里。在這種情況下,以前往往被人們忽視的一個重要問題??如何保證數(shù)據(jù)、業(yè)務在重大災難過程中的平安,進而讓已經(jīng)嚴重依賴它們的企業(yè)、機構(gòu)順利渡過難關(guān),在最短的時間內(nèi)恢復正常運轉(zhuǎn)??很明確地擺在人們面前。
這樣我們面臨著一個矛盾:信息化的不斷深入,需要將眾多關(guān)鍵數(shù)據(jù)集中管理,通過數(shù)據(jù)的整合和其價值的進一步開發(fā),實現(xiàn)對業(yè)務的支撐乃至提升。另一方面,在數(shù)據(jù)大規(guī)模集中特別是關(guān)鍵數(shù)據(jù)大集中的過程中,保障信息、保障整體業(yè)務的安全的迫切性也日益突出。有權(quán)威機構(gòu)預測,在嚴重的災難之中,將有60%以上的企業(yè)因其信息系統(tǒng)被破壞、關(guān)鍵數(shù)據(jù)丟失導致的業(yè)務癱瘓而倒閉。在這種情況下,我們往往需要把雞蛋放在多個籃子里。從這一角度說,容災目前備受矚目也就不足為奇。特別是以往不會考慮容災的廣大中小企業(yè)和機構(gòu),也紛紛尋求實施容災的可能性,而電信、金融以及其他國家要害部門,更把容災作為信息系統(tǒng)進一步完善過程中的核心工作之一。
容災 并不艱深
不過對于中小企業(yè)和機構(gòu)而言,最大的顧慮在于以往容災高高在上的“地位”。以往容災大多在高端計算領域出現(xiàn),應用范圍也僅僅局限在超大型跨國企業(yè)和金融、電信的要害部門。容災方案往往也為高實施成本、高維護成本畫上等號。但是實際上,這樣的理解并不全面。
說到容災方案和技術(shù),總體上可以區(qū)分為離線式容災(冷容災)和在線容災(熱容災)兩種類型。
所謂離線式容災主要依靠備份技術(shù)來實現(xiàn)。其主要步驟是將數(shù)據(jù)通過備份系統(tǒng)備份到磁帶上面,而后將磁帶運送到異地保存管理。這種方式主要由備份軟件來實現(xiàn)備份和磁帶的管理,除去磁帶的運送和存放外,其他步驟可實現(xiàn)自動化管理。
離線式容災方案的部署和管理比較簡單,相應投資也較少。但缺點也比較明顯:由于是采用磁帶存放數(shù)據(jù),所以數(shù)據(jù)恢復較慢,而且因這種備份并非達到頻繁備份,未來得及備份的數(shù)據(jù)都會丟失,實時性比較低。
在線容災要求生產(chǎn)中心和災備中心同時工作,生產(chǎn)中心和災備中心之間有傳輸鏈路連接。數(shù)據(jù)自生產(chǎn)中心實時復制傳送到災備中心。在此基礎上,可以在應用層進行集群管理,當生產(chǎn)中心遭受災難出現(xiàn)故障時可由災備中心自動接管并繼續(xù)提供服務。應用層的管理一般由專門的軟件來實現(xiàn),可以代替管理員實現(xiàn)自動管理。
從上面的介紹中我們可以看到,容災的核心之一,是數(shù)據(jù)的復制和備份。然而在這里需要說明的是,容災與備份所實現(xiàn)的作用或者說保障的層面是不同的。數(shù)據(jù)備份實際上實現(xiàn)的是數(shù)據(jù)的保護與恢復;容災則在保護數(shù)據(jù)的基礎上,實現(xiàn)對應用、對業(yè)務乃至對整個企業(yè)正常運轉(zhuǎn)的保護。
容災方案的規(guī)劃與實施:從需求出發(fā)
既然容災體系對于我們的業(yè)務、企業(yè)日益重要,容災又是一個涉及包括業(yè)務在內(nèi)多方面內(nèi)容的一個問題,那么對于更廣范圍內(nèi)的各個信息化應用的單位而言,如何決定是否實施容災方案,決定究竟采用哪種容災方案?
從目前業(yè)內(nèi)的一般情況而言,容災方案的確定一般需要經(jīng)過7個步驟,包括災難類型分析、業(yè)務沖擊分析、當前業(yè)務環(huán)境及恢復能力分析、容災策略制訂、容災方案設計、業(yè)務連續(xù)性流程設計、業(yè)務連續(xù)性流程及容災方案管理和測試。
這一過程看似非常龐雜繁瑣,實際上并不復雜。在籌備容災項目的時候,首先需要評估、判斷目前數(shù)據(jù)、應用、數(shù)據(jù)對連續(xù)性、可用性的要求是否需要對容災進行投資。接下來是需要根據(jù)業(yè)務運作的實際情況、可能遇到的災難以及在災難發(fā)生之后對業(yè)務的影響程度進行深入分析,并且根據(jù)目前的應用架構(gòu)對災難的承受能力,確定采用的容災等級和容災的方向。接下來就可以對容災體系進行規(guī)劃和實施了。當然這其中還包括與容災相關(guān)的制度、流程、業(yè)務的梳理和整合。
具體而言,對于中小企業(yè)等對于RPO、RTO容忍程度較高、關(guān)鍵數(shù)據(jù)較少、對IT系統(tǒng)依賴相對較低的場合,可以采用低成本、高RPO、RTO的離線數(shù)據(jù)備份方式以及本地備份方案,備份介質(zhì)選擇通常可以采用磁帶。而對于關(guān)鍵數(shù)據(jù)量龐大、關(guān)鍵業(yè)務運行完全依賴于IT系統(tǒng)但是對RPO、RTO有一定的容忍度的場合,可以在本地高可用體系下,采取存儲方案高低搭配、離線備份與在線備份結(jié)合的方式實現(xiàn)容災。例如可以采用浪潮AS500存儲系統(tǒng)、SAN架構(gòu)作為主存儲系統(tǒng),浪潮AS330G2存儲系統(tǒng)、iSCSI技術(shù)作為備份存儲系統(tǒng),同時配以磁帶實施異地備份的方式來實現(xiàn)容災。
當然對于要求零數(shù)據(jù)丟失、零災難恢復時間,對用戶實現(xiàn)透明切換的關(guān)鍵部門、關(guān)鍵領域,就需要完備的災難備份體系和遠程災難備份中心。主系統(tǒng)與遠程災難備份中心往往實施相同的計算架構(gòu),在存儲解決方案上,采用同步復制的高級數(shù)據(jù)管理,在這種環(huán)境之下,更多的會采用高成本的全光纖架構(gòu)和遠程光纖傳輸方案,保證業(yè)務的連續(xù)性和高可用性。
總而言之,從目前的情況來看容災的實施既是逐漸迫在眉睫的事情,同時又是需要深入思考和規(guī)劃的事情。在容災的實施方案選擇的過程中,則有多種方案以適應各種不同層次、不同目標的容災需求。選擇容災方案的出發(fā)點,根本還是依據(jù)實際情況而行。