13.1 容災方法的具體分析

    13.1.1 災難備份需求的衡量指標

    對于大多數(shù)企業(yè)而言,提到災難備份,最直接的反映就是增加預算,購買更多的主機,存儲設備以及相應軟件。雖然這是實施災難備份項目的一個必要步驟,但是,從“災備方案應是風險和成本相應平衡”的出發(fā)點來綜合考慮,實施災難備份項目的第一步應該從“分析評估以確定災難災難備份需求目標”開始。

    RTO (Recovery Time Objective)

    RTO,Recovery Time Objective,是指災難發(fā)生后,從I/T 系統(tǒng)當機導致業(yè)務停頓之刻開始,到IT 系統(tǒng)恢復至可以支持各部門運作,業(yè)務恢復運營之時,此兩點之間的時間段稱為RTO。

    一般而言,RTO 時間越短,即意味要求在更短的時間內(nèi)恢復至可使用狀態(tài)。雖然從管理的角度而言,RTO 時間越短越好,但是,這同時也意味著更多成本的投入,即可能需要購買更快的存儲設備或高可用性軟件。

    對于不同行業(yè)的企業(yè)來說,其RTO 目標一般是不相同的。即使是在同一行業(yè),各企業(yè)因業(yè)務發(fā)展規(guī)模的不同,其RTO 目標也會不盡相同。

    RTO 目標的確定可以用下圖來說明:

    如上所說,RTO 目標越短,成本投入也越大。另一方面,各企業(yè)都有其在該發(fā)展階段的單位時間贏利指數(shù),該指數(shù)是通過業(yè)務沖擊分析(BIA-Business Impact Analysis)咨詢服務,以交談、問答和咨詢的方式得到確定的。在確定了企業(yè)的單位時間贏利指數(shù)后,就可以計算出業(yè)務停頓隨時間而造成的損失大小。如上圖,結合這兩條曲線關系,存儲工程師將可以找到對該企業(yè)而言比較適合的RTO 目標,即在該目標定義下,用于災難備份的投入應不大與對應的業(yè)務損失。

    RPO (Recovery Point Objective)

    RPO,Recovery Point Objective,是指從系統(tǒng)和應用數(shù)據(jù)而言,要實現(xiàn)能夠恢復至可以

    支持各部門業(yè)務運作,系統(tǒng)及生產(chǎn)數(shù)據(jù)應恢復到怎樣的更新程度。這種更新程度可以是上一周的備份數(shù)據(jù),也可以是上一次交易的實時數(shù)據(jù)。


圖13-1 RTO 目標確定指標圖


    與RTO 目標不同,RPO 目標的確定不是依賴于企業(yè)業(yè)務規(guī)模,而是決定于企業(yè)業(yè)務的性質(zhì)和業(yè)務操作依賴于數(shù)據(jù)的程度。因此,RPO 目標對相同行業(yè)的企業(yè)而言會有些接近,而對于不同行業(yè)的企業(yè)來說仍可能會有較大差距。

    RPO 目標仍是以咨詢的方式,通過與各業(yè)務部門主管的交流,了解業(yè)務流程和IT 應用的關系,以及通過回答問卷的方式,確定能夠支持該企業(yè)核心業(yè)務的RPO 目標。

    13.1.2 重要系統(tǒng)災難備份主要的實現(xiàn)方法

    在目前的技術條件下,重要系統(tǒng)災難備份主要的實現(xiàn)方法主要有一下幾種:


  1. 基于應用本身的容災—-應用直接指向2 個同時運作的數(shù)據(jù)中心,在任意一個中心活動情況下繼續(xù)工作
  2. 基于文件/數(shù)據(jù)庫日志—-通過復制數(shù)據(jù)庫日志和數(shù)據(jù)文件方式,從生產(chǎn)中心向海量存儲系統(tǒng)進行數(shù)據(jù)容災
  3. 基于復制磁盤容災—-通過復制磁盤IO 的方式,從生產(chǎn)中心向海量存儲系統(tǒng)進行數(shù)據(jù)容災,根據(jù)復制設備的不同,又可以分為:
  4. 基于主機
  5. 基于磁盤陣列
  6. 基于智能SAN 虛擬存儲設備

    下面對各種方式進行一個簡單比較:

    表 13-1 容災方式比較


    13.1.3 災難備份方式比較的分析

    各種容災方式下,只有基于應用本身的方式可以做到RTO 為0;其它方式一般需要進行網(wǎng)絡切換、存儲切換和數(shù)據(jù)庫重啟等工作,RTO 一般從幾十分鐘到數(shù)小時不等;一般都要求主機和數(shù)據(jù)庫同步,雖然存在理論上的異構可能,但是在具體實施時會給開發(fā)/測試帶來巨大的難度,并大大降低容災系統(tǒng)的穩(wěn)定程度,一般不會采用。

    基于應用本身的方式雖然可以做到RTO 為0,但是對應用要求極高,并且需要極其復雜的機制處理雙中心的數(shù)據(jù)同步問題;目前浙江系統(tǒng)眾多,應用復雜,如果采用這種方案,需要對所有應用進行更改,實施難度極大,顧不予推薦?;诨谖募?數(shù)據(jù)庫日志的方式,只能以文件方式傳輸數(shù)據(jù),數(shù)據(jù)丟失單位至少一個文件,無法做到RTO=0,在不允許丟失數(shù)據(jù)的關鍵應用上也不適合,顧不予推薦?;趶椭拼疟P容災主要有同步和異步2種方式,異步方式無法做到RTO=0,在不允許丟失數(shù)據(jù)的關鍵應用上也不適合,顧不予推薦;同步方式的情況下,以復制主題不同進行分類?;谥鳈C復制磁盤數(shù)據(jù):磁盤陣列可以異構是最大的優(yōu)點;但是,這種方式容災時對主機性能有一定影響,針對不同的主機需要采用不同的實現(xiàn)方式,目前浙江系統(tǒng)眾多,應用復雜,如果采用這種方案,需要對所有主機進行論證和實施,實施難度較大,顧不予推薦

    基于磁盤陣列復制磁盤數(shù)據(jù):實施簡單是最大的優(yōu)點,不影響主機,只鏡像數(shù)據(jù),是目前較主流的一種容災方案;但是,這種方式容災時,需要磁盤陣列高度同構,不但要求磁盤陣列是一個廠商的,還必須是同一廠商同一系列的陣列,否則無法實現(xiàn)數(shù)據(jù)復制,所以,這種方案多用于已經(jīng)進行存儲整合的大型系統(tǒng);目前浙江的現(xiàn)實情況是系統(tǒng)非常多,不同系統(tǒng)采用不同磁盤陣列,很多目前的系統(tǒng)還不支持磁盤陣列的遠程鏡像功能;如果實施這種方案,首先需要升級/替換很多磁盤陣列,然后為每一種陣列在海量存儲系統(tǒng)配置相應的同構磁盤陣列,投資巨大,每一種不同的陣列采用不同的軟件,維護不便,而且,中心的各個存儲各自工作,沒有一個統(tǒng)一存儲池能夠靈活調(diào)配資源,資源使用也狠浪費

    基于智能SAN 虛擬存儲設備復制磁盤數(shù)據(jù):這種方式擁有所有基于磁盤陣列復制磁盤數(shù)據(jù)的優(yōu)點,而且通過這種方式可以解決許多基于磁盤陣列無法解決的問題:


    所以,在目前情況下,基于智能SAN 虛擬存儲設備進行磁盤復制的方式是最適合目前項目需要的,也是存儲工程師主要推薦的方案。

分享到

多易

相關推薦