人們漸漸回歸理想,更加清晰地看清楚云計算的真面目??梢哉f,無論多么高遠的夢想還是要找到穩(wěn)固的立足點,云服務最終還是要從一個數(shù)據(jù)中心被傳輸?shù)搅硗庖粋€數(shù)據(jù)中心,在這個過程仍然擺脫不了需要人、計算機、網(wǎng)絡、電能、存儲等之間協(xié)同工作。這樣一來,整個過程出現(xiàn)錯誤和漏洞就在所難免,再加上天災人禍。所以,啟用云服務你必須有一定的思想準備,同時要有第二手的解決方案來應對。

編者在這里回顧一下近年來發(fā)生的一系列斷網(wǎng)事件背后的原因。從2009年-2012年之間。也許能讓你看到:即便是計算機出錯似乎在所難免,再保險的措施似乎也只能把安全事件控制在一個小概率范圍內(nèi)。

斷網(wǎng)類型一:系統(tǒng)故障

典型事件1:亞馬遜AWS平安夜斷網(wǎng)

故障原因:彈性負載均衡服務故障

2012年12月24日,剛剛過去的圣誕節(jié)平安夜,亞馬遜并沒有讓他們的客戶過得太平安。亞馬遜AWS位于美國東部1區(qū)的數(shù)據(jù)中心發(fā)生故障,其彈性負載均衡服務(Elastic Load Balancing Service)中斷,導致Netflix和Heroku等網(wǎng)站受到影響。其中,Heroku在之前的AWS美國東部區(qū)域服務故障中也受到過影響。不過,有些巧合的事情是Netflix的競爭對手,亞馬遜自己的業(yè)務Amazon Prime Instant Video并未因為這個故障而受到影響。

12月24日,亞馬遜AWS中斷服務事件不是第一次,當然也絕非最后一次。

2012年10月22日,亞馬遜位于北維吉尼亞的網(wǎng)絡服務AWS也中斷過一次。其原因與上次相似。事故影響了包括Reddit、Pinterest等知名大網(wǎng)站。中斷影響了彈性魔豆服務,其后是彈性魔豆服務的控制臺,關(guān)系數(shù)據(jù)庫服務,彈性緩存,彈性計算云EC2,以及云搜索。這次事故讓很多人認為,亞馬遜是應該升級其北維尼吉亞數(shù)據(jù)中心的基礎設施了。

2011年4月22日,亞馬遜云數(shù)據(jù)中心服務器大面積宕機,這一事件被認為是亞馬遜史上最為嚴重的云計算安全事件。由于亞馬遜在北弗吉尼亞州的云計算中心宕機,包括回答服務Quora、新聞服務Reddit、Hootsuite和位置跟蹤服務FourSquare在內(nèi)的一些網(wǎng)站受到了影響。亞馬遜官方報告中聲稱,此次事件是由于其EC2系統(tǒng)設計存在漏洞和設計缺陷,并且在不斷修復這些已知的漏洞和缺陷來提高EC2(亞馬遜ElasticComputeCloud服務)的競爭力。

2010年1月,幾乎6萬8千名的Salesforce.com用戶經(jīng)歷了至少1個小時的宕機。Salesforce.com由于自身數(shù)據(jù)中心的"系統(tǒng)性錯誤",包括備份在內(nèi)的全部服務發(fā)生了短暫癱瘓的情況。這也露出了Salesforce.com不愿公開的鎖定策略:旗下的PaaS平臺、Force.com不能在Salesforce.com之外使用。所以一旦Salesforce.com出現(xiàn)問題,F(xiàn)orce.com同樣會出現(xiàn)問題。所以服務發(fā)生較長時間中斷,問題將變得很棘手。

分享到

tangrong

相關(guān)推薦