7.1 容災(zāi)技術(shù)的意義
當(dāng)應(yīng)用系統(tǒng)的一個(gè)完整環(huán)境因?yàn)?zāi)難性事件(如火災(zāi)、地震等)遭到破壞時(shí),為了迅速恢復(fù)應(yīng)用系統(tǒng)的數(shù)據(jù)、環(huán)境,立即恢復(fù)應(yīng)用系統(tǒng)的運(yùn)行,保證系統(tǒng)的可用性,這就需要異地災(zāi)難備份系統(tǒng)(也稱容災(zāi)系統(tǒng))。可以說(shuō),對(duì)于關(guān)鍵事物的處理系統(tǒng),如聯(lián)通的各項(xiàng)業(yè)務(wù)系統(tǒng)(客戶服務(wù)、計(jì)費(fèi)、IDC 等),建立最高級(jí)別的安全體系,也是提高服務(wù)質(zhì)量、在競(jìng)爭(zhēng)中立于不敗之地的重要舉措。
長(zhǎng)期以來(lái),對(duì)企業(yè)而言,建立一套可行的容災(zāi)系統(tǒng)相當(dāng)困難,主要是高昂的成本和技術(shù)實(shí)現(xiàn)的復(fù)雜度。鑒于此,從可行性而言,必須具有良好的性能價(jià)格比。
建立異地容災(zāi)系統(tǒng),即指建立遠(yuǎn)程的數(shù)據(jù)中心,通過(guò)配置遠(yuǎn)程容災(zāi)系統(tǒng)將本地?cái)?shù)據(jù)實(shí)時(shí)進(jìn)行遠(yuǎn)程復(fù)制,同時(shí)實(shí)現(xiàn)本地系統(tǒng)故障時(shí)應(yīng)用系統(tǒng)的遠(yuǎn)程啟動(dòng),確保系統(tǒng)的不中斷運(yùn)行。
建立異地容災(zāi)中心的優(yōu)勢(shì)在于:
隨著數(shù)據(jù)安全技術(shù)的發(fā)展,Cluster(HA)的技術(shù)越來(lái)越成熟,Cluster 的部署越來(lái)越普及,Cluster 技術(shù)確實(shí)解決了用戶系統(tǒng)的高可用性問(wèn)題,為業(yè)務(wù)的良性發(fā)展提供了穩(wěn)定的基石。隨著業(yè)務(wù)的發(fā)展,商業(yè)環(huán)境對(duì)服務(wù)供應(yīng)商提出的要求也越來(lái)越苛刻,這必將使應(yīng)用系統(tǒng)及其數(shù)據(jù)對(duì)高可用性的要求走上一個(gè)新的臺(tái)階。
一個(gè)本地Cluster 系統(tǒng)理論上可以提供99.99%以上的系統(tǒng)高可用性,但一旦發(fā)生火災(zāi)、自然災(zāi)害、人為破壞等意外事件,服務(wù)商將如何應(yīng)對(duì)呢?如果沒有必要的準(zhǔn)備和應(yīng)對(duì)手段,這樣的一次意外對(duì)服務(wù)上來(lái)說(shuō)將是災(zāi)難性的。對(duì)于IT 部門來(lái)講,要提高自己的抗災(zāi)能力,其必要的技術(shù)就是建立起一個(gè)容災(zāi)系統(tǒng)。
7.2 容災(zāi)技術(shù)的分類
一個(gè)容災(zāi)系統(tǒng)的實(shí)現(xiàn)可以采用不同的技術(shù),一種技術(shù)是:采用硬件進(jìn)行遠(yuǎn)程數(shù)據(jù)復(fù)制,存儲(chǔ)工程師稱為硬件復(fù)制技術(shù)。這種技術(shù)的提供者是一些存儲(chǔ)設(shè)備廠商。數(shù)據(jù)的復(fù)制完全通過(guò)專用線路實(shí)現(xiàn)物理存儲(chǔ)設(shè)備之間的交換。另一種技術(shù)是:采用軟件系統(tǒng)實(shí)現(xiàn)遠(yuǎn)程的實(shí)時(shí)數(shù)據(jù)復(fù)制,并且實(shí)現(xiàn)遠(yuǎn)程的全程高可用體系(遠(yuǎn)程監(jiān)控和切換)。這種技術(shù)的代表如VERITAS 等一些著名存儲(chǔ)軟件廠商。存儲(chǔ)工程師在下面的章節(jié)會(huì)對(duì)以上兩種技術(shù)進(jìn)行詳細(xì)的論述。
容災(zāi)系統(tǒng)的歸類在另一個(gè)方面要由其最終達(dá)到的效果來(lái)決定。從其對(duì)系統(tǒng)的保護(hù)程度來(lái)分,存儲(chǔ)工程師可以將容災(zāi)系統(tǒng)分為:數(shù)據(jù)容災(zāi)和應(yīng)用容災(zāi)。
所謂數(shù)據(jù)容災(zāi),就是指建立一個(gè)異地的數(shù)據(jù)系統(tǒng),該系統(tǒng)是本地關(guān)鍵應(yīng)用數(shù)據(jù)的一個(gè)實(shí)時(shí)復(fù)制。在本地?cái)?shù)據(jù)及整個(gè)應(yīng)用系統(tǒng)出現(xiàn)災(zāi)難時(shí),系統(tǒng)至少在異地保存有一份可用的關(guān)鍵業(yè)務(wù)的數(shù)據(jù)。該數(shù)據(jù)可以是與本地生產(chǎn)數(shù)據(jù)的完全實(shí)時(shí)復(fù)制,也可以比本地?cái)?shù)據(jù)略微落后,但一定是可用的。
所謂應(yīng)用容災(zāi),是在數(shù)據(jù)容災(zāi)的基礎(chǔ)上,在異地建立一套完整的與本地生產(chǎn)系統(tǒng)相當(dāng)?shù)膫浞輵?yīng)用系統(tǒng)(可以是互為備份)。建立這樣一個(gè)系統(tǒng)相對(duì)比較復(fù)雜,不僅需要一份可用的數(shù)據(jù)復(fù)制,還要有包括網(wǎng)絡(luò)、主機(jī)、應(yīng)用、甚至IP 等資源,以及各資源之間的良好協(xié)調(diào)。應(yīng)用容災(zāi)應(yīng)該說(shuō)是真正意義上的容災(zāi)系統(tǒng)。
存儲(chǔ)工程師先討論一下數(shù)據(jù)容災(zāi)。
數(shù)據(jù)容災(zāi)(硬件容災(zāi)方案和軟件容災(zāi)方案均包括),又稱為異地?cái)?shù)據(jù)復(fù)制技術(shù),按照其實(shí)現(xiàn)的技術(shù)方式來(lái)說(shuō),主要可以分為同步傳輸方式和異步傳輸方式(各廠商在技術(shù)用語(yǔ)上可能有所不同。而根據(jù)容災(zāi)的距離,數(shù)據(jù)容災(zāi)又可以分成遠(yuǎn)程數(shù)據(jù)容災(zāi)和近程數(shù)據(jù)容災(zāi)方式。下面,存儲(chǔ)工程師將主要按同步傳輸方式和異步傳輸方式對(duì)數(shù)據(jù)容災(zāi)展開討論,其中也會(huì)涉及到遠(yuǎn)程容災(zāi)和近程容災(zāi)的概念,并作相應(yīng)的分析。