摘要:如果我們可以從上個月發(fā)生的停用事件中得到一個教訓(xùn)的話,那么我想應(yīng)該就是云計算故障總是會發(fā)生的。宕機(jī)事件放大了云計算的重要性在六月發(fā)生的兩次宕機(jī)事件都是由電氣故障引起的。
如果我們可以從上個月發(fā)生的AWS停用事件中得到一個教訓(xùn)的話,那么我想應(yīng)該就是“云計算故障總是會發(fā)生的”。IT專業(yè)人士以及其他的專家均表示,如果你希望在發(fā)生故障事件時你可以迅速作出反應(yīng),那么你較好事先就做好應(yīng)對計劃。
根據(jù)不同應(yīng)用程序和數(shù)據(jù)的不同重要等級,那些應(yīng)對計劃包括在客戶自己的數(shù)據(jù)中心中運行冗余服務(wù)器,或使用多個云計算供應(yīng)商來建立網(wǎng)絡(luò)。
時刻做好發(fā)生故障的準(zhǔn)備,LiveFamily的創(chuàng)始人和CTO David Blinder說,LiveFamily是一個從事家譜研究的Facebook應(yīng)用程序,同時也是位于華盛頓州Bellevue Intelius公司的一個部門。
在Amazon網(wǎng)絡(luò)服務(wù)(AWS)基礎(chǔ)設(shè)施上運行的LiveFamily在六月中受到了兩次停用事件的影響,雖然其危害并不是災(zāi)難性的。這部分是因 為該公司使用了RightScale公司的云計算管理包,如果情況需要而且用戶愿意支付費用,該產(chǎn)品可重新分配路由和網(wǎng)絡(luò)流量至不同的云計算供應(yīng)商。
但是,提供高層次彈性功能并不是免費。專家提醒說,客戶需要自行決定哪些應(yīng)用程序是真正關(guān)鍵重要的。
IBM公司的業(yè)務(wù)連續(xù)性和彈性服務(wù)組向他們的潛在客戶進(jìn)行了一次調(diào)查,內(nèi)容就是在建立托管服務(wù)前哪些應(yīng)用程序是關(guān)鍵,IBM公司的杰出工程師Rich Cocchiara說。
“讓我們確定你需要擁有的服務(wù)等級,為你提供你所需要服務(wù)種類的服務(wù)等級對象和協(xié)議,”Cocchiara說?!绊槺阏f一句,并不是所有的業(yè)務(wù)流程和應(yīng)用程序都是一樣的?!?/p>
保護(hù)系統(tǒng)停用可以非常簡單,就如同在客戶的數(shù)據(jù)中心中保持私有云計算設(shè)備?;蛘?,它可能需要在不同的AWS可用性區(qū)域設(shè)立鏡像站點;它也可能很復(fù)雜,如運行多個云計算平臺。
“我們確實曾受到影響,但是我們的緩沖系統(tǒng)通過在發(fā)生問題時切換回本地處理與存儲基礎(chǔ)設(shè)施而挽救了我們,”匹茲堡LAN聯(lián)盟主席Colin Dean說,這是一個舉辦視頻游戲運動賽事的組織。“有某種故障安全的考慮是理想的,即在發(fā)生故障時,把你的網(wǎng)站轉(zhuǎn)至備用?!?/p>
AWS宕機(jī)事件放大了云計算的重要性
AWS在六月發(fā)生的兩次宕機(jī)事件都是由電氣故障引起的。第二次停用事件源于東海岸發(fā)生的大規(guī)模雷電天氣所引發(fā)電氣備用系統(tǒng)發(fā)生不可事先預(yù)見的故障。停用事件也對公司位于美國東1區(qū)的可用區(qū)域之一造成了影響,該區(qū)域是AWS較大的一個,其中至少有10個數(shù)據(jù)中心。
在6月29日至6月30日晚上的幾個小時中,諸如Pinterest、Netflix以及Instagram等大量的大型網(wǎng)站都不可用。
此外,宕機(jī)事件也造成了AWS“控制面板”的崩潰問題——這也使問題進(jìn)一步惡化。
就公司本身而言,Amazon已表示,公司將重新認(rèn)證或更換未能正常運行的備用發(fā)電設(shè)備,同時調(diào)整硬件參數(shù),如在切換發(fā)動機(jī)電源前等待多長時間以便于電源波動穩(wěn)定下來。
AWS表示,這次發(fā)生的宕機(jī)事件并未影響“顯著”數(shù)量的客戶,雖然只有一個基于云計算的交友網(wǎng)站表示,受停用事件影響它將更換云計算供應(yīng)商。
AWS沒有透露有多少客戶或用戶受到了宕機(jī)事件的影響。
LiveFamily有幸提前做好了應(yīng)急預(yù)案,并在發(fā)生問題時成功地在不同的可用區(qū)域中運行AWS實例,雖然問題的發(fā)生是情有可原的,但是我們“確實受到了影響”,Blinder說。
RightScale云計算管理:Opscode Chef簡化恢復(fù)任務(wù)
除了提供其他的云計算自動化功能,包括RightScale公司的云計算管理以及其他諸如Opscode公司的Chef在內(nèi)的產(chǎn)品可以有助于簡化客戶從停用事件恢復(fù)的操作任務(wù)。
“故障總是會發(fā)生的,”位于西雅圖Opscode公司的CCO和共同創(chuàng)始人Jesse Robbins說,Opscode公司主要致力于Chef云計算基礎(chǔ)設(shè)施自動化產(chǎn)品。
與RightScale類似,Chef支持多種云計算平臺,其中包括AWS、OpenStack、微軟公司的Window Azure,同時該公司剛剛宣布支持Google公司的計算引擎。
“如Chef這樣的工具可幫助你在發(fā)生故障時自動轉(zhuǎn)換至另一個云計算供應(yīng)商或為你提供自己的云計算,”Robbins補(bǔ)充道?!叭绻愕那捌跍?zhǔn)備工作做得充分,那么發(fā)生故障僅僅只是一次意外事件,一次緊急事件,而非一場災(zāi)難?!?/p>
Jeremy Przygode是位于洛杉磯Stratalux公司的共同創(chuàng)始人和CEO,AWS的經(jīng)銷商,Opscode的客戶。提供基于云計算技術(shù)管理服務(wù)的 Stratalux公司也有部分客戶受到了六月下旬發(fā)生的停用事件的影響,但是公司處理事件顯得從容不迫?!皢栴}發(fā)生了,”Przygode說。
運行多個云計算:復(fù)雜卻有效
對于那些真正無法承受停機(jī)時間的客戶來說,諸如RightScale、Opscode以及其他供應(yīng)商提供的工具可使客戶運行多個云計算,但是這種做法是比較復(fù)雜的。
“這真的很難做到,”位于康涅狄格州斯坦福德的Gartner研究公司首席分析師Kyle Hilgendorf說,“你必須在另一個供應(yīng)商那里保留一個確切應(yīng)用程序棧的鏡像副本,然后你必須弄清楚如果其中一個發(fā)生故障時你該如何應(yīng)對故障,切換至正常的云計算供應(yīng)商?!?/p>
事實上,很多專家都認(rèn)為,在云計算中實施關(guān)鍵任務(wù)應(yīng)用程序?qū)嶋H上可有助于防止停用事件。
“我的專業(yè)背景告訴我,云計算是防止這些類型停用事件的工具,即提供某些客戶用戶之前不曾擁有過的某些功能,”IBM公司的Cocchiara說。
“因此,云計算不僅實現(xiàn)了價格實惠,而且因為它依賴于多個云計算中心,從而賦予用戶們決定他們應(yīng)采取何種風(fēng)險水平的能力,”Cocchiara補(bǔ)充道。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/3654.html
摘要:宕機(jī)事件放大了云計算的重要性在六月發(fā)生的兩次宕機(jī)事件都是由電氣故障引起的。因此,云計算不僅實現(xiàn)了價格實惠,而且因為它依賴于多個云計算中心,從而賦予用戶們決定他們應(yīng)采取何種風(fēng)險水平的能力,補(bǔ)充道。 如果我們可以從上個月發(fā)生的AWS停用事件中得到一個教訓(xùn)的話,那么我想應(yīng)該就是云計算故障總是會發(fā)生的。IT專業(yè)人士以及其他的專家均表示,如果你希望在發(fā)生故障事件時你可以迅速作出反應(yīng),那么你較好事先就做...
摘要:相比較微博的服務(wù)中斷,來自金融業(yè)的服務(wù)中斷所造成的影響和損失都要大很多。那么,在新的云計算時代,企業(yè)如何以更低的成本更低的門檻建立屬于自己的新型多活系統(tǒng)正在成為一個新命題。近期,娛樂圈的百瓜齊放也讓微博遭受了前所未有的飽和瓜擊,微博的服務(wù)沒有像之前那樣,流量一旦直線上升就會出現(xiàn)宕機(jī)問題,的確有了不小的提升。但這并不意味著類似的宕機(jī)和服務(wù)中斷問題就不多。在過去幾年間,業(yè)界排名靠前的云計算廠商們...
摘要:負(fù)載均衡服務(wù)一般都會有內(nèi)外網(wǎng)隔離健康檢查等功能,從而提高系統(tǒng)的安全性和可用性。很多負(fù)載均衡服務(wù)還會提供多支持,支持跨的高可用和后端部署。 歡迎訪問網(wǎng)易云社區(qū),了解更多網(wǎng)易技術(shù)產(chǎn)品運營經(jīng)驗。 一個互聯(lián)網(wǎng)產(chǎn)品在搭建服務(wù)時可能經(jīng)常會遇到以下困境:搭建的單節(jié)點 web服務(wù)性能和可靠性都無法達(dá)到要求,節(jié)點掛掉=服務(wù)異常;直接使用外網(wǎng)提供服務(wù),經(jīng)常會擔(dān)心被人攻破,且公司運維團(tuán)隊水平較低,一不小心...
摘要:演講嘉賓簡介蔡松露子嘉,阿里云云數(shù)據(jù)庫總架構(gòu)師,主要負(fù)責(zé)阿里云技術(shù)以及阿里云數(shù)據(jù)庫整體架構(gòu)等工作。也就是說以上的四點只是達(dá)到了云原生數(shù)據(jù)庫的門檻值,還并不代表是這一個云原生的數(shù)據(jù)庫。 摘要:POLARDB是阿里云ApsaraDB數(shù)據(jù)庫團(tuán)隊研發(fā)的基于云計算架構(gòu)的下一代關(guān)系型數(shù)據(jù)庫,其最大的特色是計算節(jié)點與存儲節(jié)點分離,借助優(yōu)秀的RDMA網(wǎng)絡(luò)以及最新的塊存儲技術(shù)。POLARDB不但滿足了公...
閱讀 802·2023-04-25 20:32
閱讀 2442·2021-11-24 10:27
閱讀 4622·2021-09-29 09:47
閱讀 2331·2021-09-28 09:36
閱讀 3726·2021-09-22 15:27
閱讀 2853·2019-08-30 15:54
閱讀 425·2019-08-30 11:06
閱讀 1327·2019-08-30 10:58