摘要:智能調(diào)度系統(tǒng)實時監(jiān)測集群所有計算節(jié)點計算存儲網(wǎng)絡(luò)等負載信息,作為虛擬機調(diào)度和管理的數(shù)據(jù)依據(jù)。當(dāng)有新的虛擬資源需要部署時,調(diào)度系統(tǒng)會優(yōu)先選擇低負荷節(jié)點進行部署,確保整個集群節(jié)點的負載。
智能調(diào)度是 UCloudStack 平臺虛擬機資源調(diào)度管理的核心,由調(diào)度模塊負責(zé)調(diào)度任務(wù)的控制和管理,用于決策虛擬機運行在哪一臺物理服務(wù)器上,同時管理虛擬機狀態(tài)及遷移計劃,保證虛擬機可用性和可靠性。
智能調(diào)度系統(tǒng)實時監(jiān)測集群所有計算節(jié)點計算、存儲、網(wǎng)絡(luò)等負載信息,作為虛擬機調(diào)度和管理的數(shù)據(jù)依據(jù)。當(dāng)有新的虛擬資源需要部署時,調(diào)度系統(tǒng)會優(yōu)先選擇低負荷節(jié)點進行部署,確保整個集群節(jié)點的負載。如下圖所示,新創(chuàng)建的虛擬資源將會通過調(diào)度檢測,自動部署至負載較低的 Node3 節(jié)點上。
調(diào)度系統(tǒng)在優(yōu)先選擇低負荷節(jié)點進行虛擬資源部署的同時,分別提供打散部署、在線遷移、宕機遷移等能力,整體保證云平臺的可靠性。UCloudStack 云平臺使用分布式存儲提供存儲服務(wù),如上圖所示,虛擬機均運行于分布式存儲池之上,且分布式存儲池可跨多臺物理機構(gòu)建統(tǒng)一分布式存儲資源池。虛擬機的系統(tǒng)盤、鏡像文件及掛載的硬盤均存儲于統(tǒng)一分布式存儲池中,每臺計算節(jié)點均可通過分布式存儲池中的虛擬機的系統(tǒng)盤文件及配置信息注冊一個相同的虛擬機進程,可作用于在線遷移或宕機遷移任務(wù)。
在線遷移(虛擬機熱遷移)是計劃內(nèi)的遷移操作,即虛擬機不停機的情況下,在不同的物理機之間進行在線跨機遷移。首先是在目標(biāo)物理機注冊一個相同配置的虛擬機進程,然后進行虛擬機內(nèi)存數(shù)據(jù)同步,最終快速切換業(yè)務(wù)到目標(biāo)新虛擬機。整個遷移切換過程非常短暫,幾乎不影響或中斷用戶運行在虛擬機中的業(yè)務(wù),適用于云平臺資源動態(tài)調(diào)整、物理機停機維護、優(yōu)化服務(wù)器能源消耗等場景,進一步增強云平臺可靠性。
由于采用分布式統(tǒng)一存儲,虛擬機在線遷移時只遷移 【計算】 的運行位置,不涉及 【存儲】(系統(tǒng)盤、鏡像、云硬盤)位置遷移。遷移時僅需通過統(tǒng)一存儲內(nèi)的源虛擬機配置文件在目的主機上注冊一個相同配置且狀態(tài)置為暫停的虛擬機進程,然后反復(fù)遷移源虛擬機的內(nèi)存至目的虛擬機,待虛擬機內(nèi)存同步一致后,關(guān)閉源虛擬機并激活目標(biāo)虛擬機進程,最后進行網(wǎng)絡(luò)切換并成功接管源虛擬機業(yè)務(wù)。
整個遷移任務(wù)僅在激活目標(biāo)虛擬機及網(wǎng)絡(luò)切換時業(yè)務(wù)處于短暫中斷,由于激活和切換所用時間很短,少于 TCP 超時重傳時間,因此源虛擬機業(yè)務(wù)幾乎無感知。同時由于無需遷移虛擬機磁盤及鏡像位置,虛機掛載的云盤遷移后不受影響,可為用戶提供無感知且攜帶存儲數(shù)據(jù)的遷移服務(wù)。具體遷移過程如下:
整個遷移過程中,從源虛擬機暫停至目標(biāo)虛擬機激活并完成網(wǎng)絡(luò)切換為停機時間,由于激活虛擬機及網(wǎng)絡(luò)切換時間非常短暫,通常小于幾百毫秒,少于 TCP 超時重傳時間,對大多數(shù)應(yīng)用服務(wù)來說可忽略不計,因此虛擬機業(yè)務(wù)幾乎不會感知到遷移停機。如智能調(diào)度圖中的 VM6 默認運行在 Node1 上,管理員通過在線遷移功能手動將 VM6 遷移至 Node3 的流程如下:
宕機遷移又稱離線遷移(Offline Migration)或虛擬機高可用( High Availability),指平臺底層物理機出現(xiàn)異?;蚬收隙鴮?dǎo)致宕機時,調(diào)度系統(tǒng)會自動將其所承載的虛擬資源快速遷移到健康且負載正常的物理機,盡量保證業(yè)務(wù)的可用性。整體宕機遷移不涉及存儲及數(shù)據(jù)遷移,新虛擬機可快速在新物理機上運行,平均遷移時間為 90 秒左右,可能會影響或中斷運行在虛擬機中的業(yè)務(wù)。
由于采用分布式統(tǒng)一存儲,虛擬機的系統(tǒng)盤及寫進系統(tǒng)盤的數(shù)據(jù)均存儲在底層分布式存儲中,虛擬機宕機遷移只遷移 【計算】 的運行位置,不涉及 【存儲】(系統(tǒng)盤、鏡像、云硬盤)位置遷移,僅需在新物理機上重新啟動虛擬機并保證網(wǎng)絡(luò)通信即可。遷移機制說明如下:
整個遷移過程,從檢測到故障至遷移成功平均為 90 秒左右。虛擬機啟動時間與源虛擬機的組件及配置有關(guān),如綁定云硬盤、外網(wǎng) IP 、彈性網(wǎng)卡及操作系統(tǒng)等;同時由于虛擬機規(guī)格過大、底層物理資源不足、底層硬件故障等原因可能會導(dǎo)致宕機遷移失敗,通常建議盡量保證底層物理資源充足。
如智能調(diào)度圖中的 Node2 節(jié)點故障,智能調(diào)度系統(tǒng)自動將 VM3 和 VM4 分別遷移至 Node1 和 Node3 節(jié)點,具體流程如下:
宕機遷移的前提是集群中至少有 2 臺以上的物理服務(wù)器,且在遷移過程中需保證健康節(jié)點的資源充足及網(wǎng)絡(luò)連通性。通過宕機遷移技術(shù),為業(yè)務(wù)系統(tǒng)提供高可用性,極大縮短由于各種主機物理故障或鏈路故障引起的中斷時間。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/125812.html
在互聯(lián)網(wǎng)市場的頭部效應(yīng)下,企業(yè)所面臨的競爭壓力越來越大,如何有效解決獲客成本高、用戶黏性低、變現(xiàn)能力弱等問題,正是越來越多的企業(yè)開始構(gòu)建大數(shù)據(jù)平臺的初衷。但由于大數(shù)據(jù)解決方案所涉及的組件錯綜復(fù)雜、技術(shù)門檻較高,且初期投入的資源和后期的維護成本較大,十分考驗企業(yè)的大數(shù)據(jù)平臺組建和運維能力。因此,UCloud大數(shù)據(jù)團隊于近期上線了大數(shù)據(jù)智能平臺(UCloud Smart Data Platform,下...
摘要:物理集群節(jié)點云平臺系統(tǒng)常見集群節(jié)點角色有種,分別是管理節(jié)點計算存儲融合節(jié)點獨立計算節(jié)點以及獨立存儲節(jié)點。云平臺分布式存儲使用所有計算節(jié)點的數(shù)據(jù)磁盤,每個節(jié)點僅支持部署一種類型的數(shù)據(jù)磁盤,如等使用作為緩存的場景除外。2.1 物理集群節(jié)點UCloudStack 云平臺系統(tǒng)常見集群節(jié)點角色有 4 種,分別是管理節(jié)點、計算存儲融合節(jié)點、獨立計算節(jié)點、以及獨立存儲節(jié)點。2.1.1 管理節(jié)點集群內(nèi)部...
摘要:集群默認對所有租戶開放權(quán)限,平臺支持對存儲集群進行權(quán)限控制,用于將部分物理存儲資源獨享給一個或部分租戶使用,適用于專屬私有云場景。支持租戶將有權(quán)限的存儲卷信息作為虛擬機的系統(tǒng)盤,使虛擬機直接運行直商業(yè)存儲中,提升性能。4.1.1 地域地域 ( Region ) 指 UCloudStack 云平臺物理數(shù)據(jù)中心的地理區(qū)域,如上海、北京、杭州等。不同地域間完全物理隔離,云平臺資源創(chuàng)建后不能更換地域...
摘要:北京網(wǎng)絡(luò)廣播電視臺直播室樓上為運營團隊在實時監(jiān)測點擊大圖在北京網(wǎng)絡(luò)廣播電視臺的大展廳中,記者對大媒體非常驚艷。其中北京網(wǎng)絡(luò)廣播電視臺云基礎(chǔ)支撐平臺架構(gòu)圖點擊大圖涉及了服務(wù)器小型機網(wǎng)絡(luò)資源池存儲資源池操作系統(tǒng),以及在內(nèi)的虛擬化平臺。 從2013年下半年開始,媒體與新媒體的分析不絕于耳。面對借移動互聯(lián)與社交而日益蓬勃的新媒體的攻勢,傳統(tǒng)媒體是抱殘守缺,還是勇于變革?IPTV的反擊是整個產(chǎn)業(yè)的...
閱讀 1564·2025-02-07 13:29
閱讀 1002·2024-11-07 18:25
閱讀 131496·2024-02-01 10:43
閱讀 1328·2024-01-31 14:58
閱讀 1144·2024-01-31 14:54
閱讀 83571·2024-01-29 17:11
閱讀 3869·2024-01-25 14:55
閱讀 2390·2023-06-02 13:36