7.1 容災技術的意義
當應用系統(tǒng)的一個完整環(huán)境因災難性事件(如火災、地震等)遭到破壞時,為了迅速恢復應用系統(tǒng)的數(shù)據(jù)、環(huán)境,立即恢復應用系統(tǒng)的運行,保證系統(tǒng)的可用性,這就需要異地災難備份系統(tǒng)(也稱容災系統(tǒng))??梢哉f,對于關鍵事物的處理系統(tǒng),如聯(lián)通的各項業(yè)務系統(tǒng)(客戶服務、計費、IDC 等),建立最高級別的安全體系,也是提高服務質量、在競爭中立于不敗之地的重要舉措。
長期以來,對企業(yè)而言,建立一套可行的容災系統(tǒng)相當困難,主要是高昂的成本和技術實現(xiàn)的復雜度。鑒于此,從可行性而言,必須具有良好的性能價格比。
建立異地容災系統(tǒng),即指建立遠程的數(shù)據(jù)中心,通過配置遠程容災系統(tǒng)將本地數(shù)據(jù)實時進行遠程復制,同時實現(xiàn)本地系統(tǒng)故障時應用系統(tǒng)的遠程啟動,確保系統(tǒng)的不中斷運行。
建立異地容災中心的優(yōu)勢在于:
隨著數(shù)據(jù)安全技術的發(fā)展,Cluster(HA)的技術越來越成熟,Cluster 的部署越來越普及,Cluster 技術確實解決了用戶系統(tǒng)的高可用性問題,為業(yè)務的良性發(fā)展提供了穩(wěn)定的基石。隨著業(yè)務的發(fā)展,商業(yè)環(huán)境對服務供應商提出的要求也越來越苛刻,這必將使應用系統(tǒng)及其數(shù)據(jù)對高可用性的要求走上一個新的臺階。
一個本地Cluster 系統(tǒng)理論上可以提供99.99%以上的系統(tǒng)高可用性,但一旦發(fā)生火災、自然災害、人為破壞等意外事件,服務商將如何應對呢?如果沒有必要的準備和應對手段,這樣的一次意外對服務上來說將是災難性的。對于IT 部門來講,要提高自己的抗災能力,其必要的技術就是建立起一個容災系統(tǒng)。
7.2 容災技術的分類
一個容災系統(tǒng)的實現(xiàn)可以采用不同的技術,一種技術是:采用硬件進行遠程數(shù)據(jù)復制,存儲工程師稱為硬件復制技術。這種技術的提供者是一些存儲設備廠商。數(shù)據(jù)的復制完全通過專用線路實現(xiàn)物理存儲設備之間的交換。另一種技術是:采用軟件系統(tǒng)實現(xiàn)遠程的實時數(shù)據(jù)復制,并且實現(xiàn)遠程的全程高可用體系(遠程監(jiān)控和切換)。這種技術的代表如VERITAS 等一些著名存儲軟件廠商。存儲工程師在下面的章節(jié)會對以上兩種技術進行詳細的論述。
容災系統(tǒng)的歸類在另一個方面要由其最終達到的效果來決定。從其對系統(tǒng)的保護程度來分,存儲工程師可以將容災系統(tǒng)分為:數(shù)據(jù)容災和應用容災。
所謂數(shù)據(jù)容災,就是指建立一個異地的數(shù)據(jù)系統(tǒng),該系統(tǒng)是本地關鍵應用數(shù)據(jù)的一個實時復制。在本地數(shù)據(jù)及整個應用系統(tǒng)出現(xiàn)災難時,系統(tǒng)至少在異地保存有一份可用的關鍵業(yè)務的數(shù)據(jù)。該數(shù)據(jù)可以是與本地生產數(shù)據(jù)的完全實時復制,也可以比本地數(shù)據(jù)略微落后,但一定是可用的。
所謂應用容災,是在數(shù)據(jù)容災的基礎上,在異地建立一套完整的與本地生產系統(tǒng)相當?shù)膫浞輵孟到y(tǒng)(可以是互為備份)。建立這樣一個系統(tǒng)相對比較復雜,不僅需要一份可用的數(shù)據(jù)復制,還要有包括網(wǎng)絡、主機、應用、甚至IP 等資源,以及各資源之間的良好協(xié)調。應用容災應該說是真正意義上的容災系統(tǒng)。
存儲工程師先討論一下數(shù)據(jù)容災。
數(shù)據(jù)容災(硬件容災方案和軟件容災方案均包括),又稱為異地數(shù)據(jù)復制技術,按照其實現(xiàn)的技術方式來說,主要可以分為同步傳輸方式和異步傳輸方式(各廠商在技術用語上可能有所不同。而根據(jù)容災的距離,數(shù)據(jù)容災又可以分成遠程數(shù)據(jù)容災和近程數(shù)據(jù)容災方式。下面,存儲工程師將主要按同步傳輸方式和異步傳輸方式對數(shù)據(jù)容災展開討論,其中也會涉及到遠程容災和近程容災的概念,并作相應的分析。