Erin Watkins 發(fā)表于:14年07月09日 20:12 [轉(zhuǎn)載] TT中國
數(shù)據(jù)中心高可用性:“五個九”意義有多大?
高可用性對于IT生命來說很關鍵,但是對于很多企業(yè)來說,所謂的“五個九”,也就是99.999%的情況下正常運行時間不是必要的。
這99.999%的正常運行時間是否必要,取決于很多方面,從軟件限制到成本支出等等。
Linux開發(fā)者,以及High-Availability Linux計劃的奠基人Alan Robertson說:“如果事情達到一分鐘幾百萬上下,或者事關人命,那么你需要‘五個九’。”
衡量高可用性的成本
達到高可用性的代價是“四個九”或“五個九”,包括軟件、硬件、人力和培訓。組織需要衡量這些花費,對比一下意外宕機的損失和安排停機時間的能力。雖然有的公司是一分鐘幾百萬的業(yè)務,但是像是股市這樣的單位是很容易安排停機時間的——只要不是在交易時間就行,Robertson說道。
根據(jù)最近Emerson Network Power對41個數(shù)據(jù)中心的調(diào)查來看,意外宕機最大的損失來源于業(yè)務中斷和收入減少。某組織的應對方式是——查清問題,修復,然后讓系統(tǒng)還原備份,然后運行,這也需要花錢。
Sander van Vugt是荷蘭的一名獨立培訓師和顧問,他打比方說,某工作站擁有99.99%的正常運行時間,可以預測每年會有8.76小時的宕機時間。如果每小時宕機的代價是1百萬美元,總共就是876萬美元。但是如果是99.999%正常運行時間,每年宕機時間將少于1小時。這樣的話,提升正常運行時間是值得的。
Wayne Gateman建議各個公司考慮清楚:“對于任何需要權衡成本的產(chǎn)品,需要考慮宕機會對你帶來什么?對對宕機的承受能力是多少?接下來有什么風險?”
van Vugt說,“五個九”適合在想零售或者Web托管這種大容量組織,而對于線下工作站,“三個九”足矣。
達成“五個九”的正常運行時間
某些行業(yè),比如交通行業(yè),高可用性是至關重要的。比如說在荷蘭,如果因為一個電腦的故障導致所有列車停駛,那么就會有數(shù)以萬計的人正常生活受到阻礙。
Gateman建議這種情況下,需要高容錯的服務器,多冗余包括服務器硬件自身、故障轉(zhuǎn)移軟件和分離物理服務器以強制故障轉(zhuǎn)移升級的軟件,這些能讓服務器容錯,值得擁有。
在配置容錯服務器之前,Gateman的公司使用基于軟件的故障轉(zhuǎn)移工具,來保持產(chǎn)品環(huán)境運行,但這不總是符合預期。
Gateman建議:“軟件畢竟是軟件,不能每次都解決問題,比如在硬件出問題的時候。如果有內(nèi)置的冗余,虛擬中心就不會每次都受到故障侵擾。”