明尼蘇達州埃迪納Fidelity Bank的助理網(wǎng)絡(luò)管理員Rick Erickson說:“這沒有什么取巧的,你必須制定好計劃,然后一遍一遍地嘗試?!?他的團隊已經(jīng)花了2年的時間來制定災(zāi)難恢復計劃,并且近一年來,每隔幾個月都要進行一次災(zāi)難恢復測試。


      每一次測試都會有新的收獲。他說:“你可以發(fā)現(xiàn)許多問題,從確定你所使用的線纜和防火墻的配置是正確的,到確定你的地址是正確的,一切都必須得到確認?!?


      總部設(shè)在邁阿密的法律事務(wù)所Greenberg Traurig的股東和律師Luis Salazar說:“我認為要想預(yù)見到每一種情況是不可能的,但是如果你制定好計劃并去執(zhí)行它,你會發(fā)現(xiàn)許多潛在的問題?!?/P>

      Salazar并非只是站在企業(yè)客戶顧問的角度上來談制訂數(shù)據(jù)管理和業(yè)務(wù)持續(xù)性計劃的。在2005年發(fā)生威爾瑪颶風時,他自己的辦公室被完全摧毀了。幸好他比較機警,他才得以在最近的一個WiFi熱點迅速繼續(xù)開展工作,那時他連辦公室或者書桌都沒有。


      那么那些機敏的用戶需要做些什么才能確保他們的災(zāi)難恢復計劃能夠發(fā)揮實效呢? 以下是我們采訪Erickson、Salazar和其他人得出的一些觀點:


      • 設(shè)定恢復優(yōu)先權(quán)。對于大部分專家來說,這是首要任務(wù)。 內(nèi)華達州克拉克縣的高級系統(tǒng)程序員Richard Taylor說:“第一個困難是決定儲存什么/復制什么/保護什么以及擴展什么的問題。如果你認為ILM/檔案管理/HSM很難獲得一致的話,那就等到你設(shè)法讓許多相互競爭的業(yè)務(wù)部都得出它們之中只有2個業(yè)務(wù)部擁有很好的備份系統(tǒng)時再說。”


      而且,來自各級管理層尤其是最高管理層的信息輸入將有助于制定正確的列表。例如,銀行或許會認為財務(wù)報告比供貨商或者員工的信息更重要。 一家零售商或許需要將客戶清單、交易情況和存貨清單的資料都保存起來。


      • 放開你的設(shè)備,讓它們與你的要求匹配。Salazar說,一旦制定關(guān)鍵IT資源的清單,并且確定了其中最重要的項目,決定由哪些系統(tǒng)來包含那些應(yīng)用軟件就非常重要了。


      有時,測試會讓你發(fā)現(xiàn)對新技術(shù)的需求。 比如,F(xiàn)idelity Bank的Erickson的團隊發(fā)現(xiàn)他們使用的應(yīng)用軟件中有一兩款軟件的恢復能力較差,除非它們保存了虛擬服務(wù)器的離線副本。(銀行使用為人的虛擬化軟件。) 一旦虛擬服務(wù)器在遠程災(zāi)難恢復站點被復制,在更新特定數(shù)據(jù)時就會相對更快一點。


      • 明確時間計劃。制定你的恢復時間目標和恢復點目標。 例如,Erickson的團隊假定大部分的銀行交易必須在24小時內(nèi)完成。他們的災(zāi)難恢復系統(tǒng)要求借貸、運作和出納等系統(tǒng)必須能夠在意外中止后一天之內(nèi)恢復運作。 對于相對次要點的應(yīng)用軟件如內(nèi)部報告功能,也必須在2到3天以內(nèi)恢復。


      • 在需要時請求幫助。Fidelity Bank并不只單純依賴內(nèi)部建議。 為了確保萬全,Erickson和他的團隊會與廠商們就災(zāi)難恢復進行溝通。然后他們會聘請外部顧問來進行考核。


      • 將所有的變化都記錄在案。Storage Switzerland顧問公司的George Crump說:“大部分災(zāi)難恢復失敗都是由結(jié)構(gòu)和環(huán)境變化引起存儲器基礎(chǔ)結(jié)構(gòu)變化而造成的?!?


      StorageIO顧問公司的分析師Greg Schulz說:“將災(zāi)難恢復計劃的更新作為你的日常變化監(jiān)控管理工作的一部分內(nèi)容,如果你不對變化監(jiān)控進行管理,那么就將那部分工作添加到你的災(zāi)難恢復計劃中,因為它們是有關(guān)聯(lián)的。請定期審計備份和復制,以確保那些數(shù)據(jù)的正確性?!?/P>

      • 測試測試再測試。然后,就是測試了。 Schulz說:“定期審計測試計劃、程序和文檔,利用那些對流程并不熟悉的人來協(xié)助決定什么是已知的以及什么是假定成立的和什么是已經(jīng)備案的。 災(zāi)難恢復中的經(jīng)驗還是可以在一段時間內(nèi)管用的。”


      Schulz說,正確使用測試是非常重要的。 “一項成功的測試中,重點不應(yīng)該有很多,相反,重點應(yīng)該集中在發(fā)現(xiàn)并解決問題上面。我想,沒有人希望測試失敗吧。 然而,如果你找不到問題的話,它們就會變得更難解決。”


      • 不要將IT考慮在內(nèi)。如果你的IT員工不在,你的系統(tǒng)是否能夠恢復呢? 在IT專業(yè)人士不在的情況下,非技術(shù)員工如何應(yīng)付那些困難是很重要的。


      • 正確選擇你的網(wǎng)點。映射的災(zāi)難恢復站點應(yīng)該離主站點很遠,這樣它們才可能在災(zāi)難來臨時幸存下來。 例如,F(xiàn)idelity Bank選擇了14英里外的某個地點,然后用Silver Peak的數(shù)據(jù)壓縮技術(shù)來確保數(shù)據(jù)傳輸?shù)乃俣?。Salazar說,他的公司使用了一個Citrix VPN來連接邁阿密總部和災(zāi)難恢復站點。 因為如果颶風襲擊了佛羅里達州,氣象學的知識指出它可能不會深入到喬治亞州。


      上述列表很難做到完整。有人說災(zāi)難恢復實際上是一項生產(chǎn)性工作。 當時通過采取正確的措施和執(zhí)行詳細化測試,是可以獲得成功的。

分享到

多易

相關(guān)推薦