圖1:美國地震風險地圖
地震會在不發(fā)出任何警告的情況下使得數(shù)據(jù)中心運行失效,破壞數(shù)據(jù)中心的建筑及其里面的設備,甚至摧毀數(shù)據(jù)中心的整個線路。地震最可能的帶來的數(shù)據(jù)中心運行失敗是緣于地震破壞了數(shù)據(jù)中心安裝的設備和建筑元素,如地板和天花板。
設備風險
即使是滿足了當前設計建造規(guī)格的現(xiàn)代建筑,受到地震影響而導致一些設備無法正常運轉也是常見。在大多數(shù)情況下,讓建筑更具彈性,可以相當容易并相對便宜的減輕地震所帶來的約束和影響。
圖2:被毀的計算機和通信機架
比設施受損更厲害的社會影響
即使建筑物和設備抗震,其他相關設備線路線運行失敗也是常見的。例如,許多關鍵設施依托暖通空調系統(tǒng),采用蒸發(fā)冷卻,利用社區(qū)供水。如果該供應中斷,即使設備未收到損壞,也可能導致數(shù)天或數(shù)周不起作用。同樣,對于商業(yè)方面也是一樣的:大地震可能造成大面積地區(qū)臨時停電,并可能導致因強烈震動帶來的長期中斷。例如,在南加利福尼亞的一次大地震中,大多數(shù)客戶預計將斷電超過一周和受損最嚴重的地區(qū)供水中斷可能長達幾天或幾個星期。
設施備份可以降低因地震帶來的中斷操作的幾率。但如果備份是位于靠近數(shù)據(jù)中心主站點的位置,其也可能因為同一地震而不起作用。兩處越是靠近,就越有可能會因為同一原因而運行失效:他們更可能都受到強烈動搖;或兩處的線路都可能受損;或同時發(fā)生火災都需要被疏散。在設施備份的接近程度和風險之間明顯需要進行權衡。更近的備份選址可以降低后勤備份成本,但這也意味著更大的共因失效的可能性。取決于兩處數(shù)據(jù)中心的網(wǎng)站選址,“接近程度”可能為數(shù)百英里或更多。
圖3:一次加利福尼亞地震強度分析
運用風險分析
其他造成運行故障的原因可以預見并進行補救。我們甚至可以進行工程風險問題分析。專家可以計算每次地震可能影響設施運行失敗發(fā)生的概率,以及地震導致的設備無法正常運轉的特定時長。同樣的計算可以進行假設進行某些修正,如錨設備,增加應急發(fā)電機或現(xiàn)場水供應等等。通過估計和假設相關風險,可以更好地做出明智的決策,幫助進行有關的成本和效益的修復。并根據(jù)這些問題制定應急計劃。
在加州的一個公用事業(yè)機構,其管理部門委托研究在一次地震中失去其所有數(shù)據(jù)中心的可能性。他們了解到,他們的大部分風險來自地震設備限制不足和地板。過了一段時間,他們修復了一些最危險的元素,并通過針對尚未解決的項目制定工作計劃。修復決定是基于:
(1)臨界性的風險因素
(2)修理的復雜性和費用
(3)建筑物或設備的預計使用壽命,例如,定于明年報廢的則可能不會進行維修,管理可能會帶來失敗的風險
總之,一旦計算出哪種方案更便宜:地震前的修補程序或震后功能損失。通過計算其地震風險,企業(yè)可以判斷哪些故障是最有可能的,哪些是最具成本效益的解決方案。然后,他們可以修復,并制定應急計劃,以解決剩余的風險。底線是,如果您正在做的業(yè)務處在多地震的地區(qū),務必要有地震風險管理知道自己的地震風險。