摘要:摘要彈性計算服務(wù)是阿里云營收的中流砥柱和流量擔(dān)當(dāng)。實現(xiàn)產(chǎn)品到資源的精準(zhǔn)調(diào)度,并最大化資源使用效率,這,就是信息時代下的后羿系統(tǒng)需要提供的基本能力。這是后羿掌柜和強(qiáng)大的虛擬化團(tuán)隊的一次高水平運作,可謂火中取栗。
摘要: 彈性計算服務(wù)ECS(Elastic Compute Service)是阿里云營收的中流砥柱和流量擔(dān)當(dāng)。作為各行業(yè)客戶新業(yè)務(wù)和技術(shù)創(chuàng)新的發(fā)動機(jī)和使能者,ECS不僅能在10分鐘內(nèi)交付出一個中等體量互聯(lián)網(wǎng)公司所需的全部計算力,更能承載阿里集團(tuán)雙十一極大的峰值彈性需求以及互聯(lián)網(wǎng)巨頭客戶業(yè)務(wù)高峰所需的計算力,幫助所有用戶打破計算力邊界的限制。
1.引子
彈性計算服務(wù)ECS(Elastic Compute Service)是阿里云營收的中流砥柱和流量擔(dān)當(dāng)。作為各行業(yè)客戶新業(yè)務(wù)和技術(shù)創(chuàng)新的發(fā)動機(jī)和使能者,ECS不僅能在10分鐘內(nèi)交付出一個中等體量互聯(lián)網(wǎng)公司所需的全部計算力,更能承載阿里集團(tuán)雙十一極大的峰值彈性需求以及互聯(lián)網(wǎng)巨頭客戶業(yè)務(wù)高峰所需的計算力,幫助所有用戶打破計算力邊界的限制。而默默工作在舞臺背后的正是ECS的調(diào)度系統(tǒng),那個傳說中的“后羿”。作為一個創(chuàng)建交付了不計其數(shù)的虛擬機(jī)的資源調(diào)度系統(tǒng),后羿帶來的感覺就像蒙娜麗莎的微笑,神秘而好奇。今天就讓我們扒一扒“后羿”的前世與今生。
2.上古起源:后羿誕生
時光機(jī)回到2009年,那時全球的科技公司都在布局著云計算,演繹的精彩絕倫、百家爭鳴,一如當(dāng)下風(fēng)口上的區(qū)塊鏈、人工智能和新零售。也就在這一年,阿里云初試鶯啼,在云計算領(lǐng)域開天辟地,自主研發(fā)了盤古、女媧、神農(nóng)、夸父和伏羲。這些上古大神共同組成了阿里云的云計算基礎(chǔ)系統(tǒng)平臺--飛天Apsara系統(tǒng)。后羿的誕生也就水到渠成,它基于飛天將計算(Host)、網(wǎng)絡(luò)(IP)和存儲(Pangu塊存儲)等資源統(tǒng)一調(diào)度并通過虛擬化技術(shù)生產(chǎn)出一臺臺可交付給用戶使用的虛擬服務(wù)器。2010年5月,第一個ECS集群在北京上線了。此時的后羿還是一個單純的小朋友,干的活就是虛擬機(jī)生產(chǎn)線的流程控制,頭腦(調(diào)度策略)也相對比較簡單,因為一個集群內(nèi)都是同等機(jī)型、同一網(wǎng)絡(luò)Pod、同一個Pangu存儲,所以基本都是按靜態(tài)資源分配的方式進(jìn)行調(diào)度選擇。
3.工業(yè)革命:野蠻生長
唯快不破!是,就是這么快進(jìn)入“工業(yè)革命”了!雖然后羿還沒來得及懵懂幾下,但因為ECS上線之后,業(yè)務(wù)量發(fā)展非常迅猛,妥妥地成為阿里云增長最快的業(yè)務(wù),沒有之一。ECS很快用事實證明以虛擬機(jī)的方式出售計算力是云計算商業(yè)化最合適的路徑,它好比工業(yè)時代的蒸汽機(jī),推動著阿里云進(jìn)入了野蠻生長的時代。
ECS的規(guī)模很快達(dá)到了近百個飛天集群,而且每周都在繼續(xù)部署新的集群,加上每周至少發(fā)布一個新版本,這樣的節(jié)奏讓我們原來維護(hù)和升級后羿系統(tǒng)的同學(xué)不堪重負(fù)。哇,那些年一起使出洪荒之力的同學(xué),還記得苦苦掙扎的模樣嗎?伴隨著規(guī)模的增長,后羿面對的簡單小世界一下子變成了星辰大海,調(diào)度面臨的復(fù)雜度與日俱增,需要突破網(wǎng)絡(luò)Pod,需要突破機(jī)房。成長的煩惱不可避免,新的系統(tǒng)架構(gòu)設(shè)計目標(biāo),大Region級別的資源管理調(diào)度能力,快速迭代開發(fā)……
好在借力集團(tuán)的技術(shù)支撐,后羿采用了分布式服務(wù)的技術(shù)逐步重構(gòu)演進(jìn)。這期間最大的挑戰(zhàn)是業(yè)務(wù)在發(fā)展,不可能停下來給我們幾個月的時間去完成這個任務(wù)。我們使用先搭框架、再小步遷移的方案,在不影響業(yè)務(wù)發(fā)展的前提下,把一個一個功能模塊,從功能遷移到數(shù)據(jù)遷移,逐步完成系統(tǒng)升級切換,用時髦的話講這是給飛行中的飛機(jī)換引擎。換了引擎的后羿,從原來的單集群管控系統(tǒng),升級到了基于分布式服務(wù)架構(gòu)實現(xiàn)的大Region多機(jī)房管控系統(tǒng);調(diào)度策略由原來的集群內(nèi)簡單的資源分配模型升級到目前經(jīng)典的過濾器+權(quán)重因子評分模型;管理規(guī)模也由一套管控對應(yīng)最大數(shù)百臺物理機(jī)的集群變成了目前的一套管控可以管理數(shù)萬物理機(jī)規(guī)模的集群。經(jīng)過工業(yè)革命的錘煉,我們的后羿小伙子長大成人了。
這個時期ECS逐步完善的上層業(yè)務(wù)系統(tǒng),主要提供了幾大能力:
標(biāo)準(zhǔn)化的ECS Open API接口,對接官網(wǎng)售賣和API用戶;
售賣約束,接入阿里云計費系統(tǒng),實現(xiàn)了ECS特有的計費模式(包年包月、按量付費等);
在集群粒度配置業(yè)務(wù)屬性和售賣規(guī)格,按用戶的需求調(diào)度集群;
基本的庫存服務(wù)和水位控制。
4.信息時代:漸入佳境
如果說工業(yè)革命時代是規(guī)模這個單維度縱向量的高速發(fā)展,那么信息時代則是個性化、多元化的多維度發(fā)展。一方面,ECS吸引了越來越豐富的客戶群體,需求越來越多樣化,包括不同的價格需求、穩(wěn)定性需求、地域需求等等,這就需要ECS包裝出不同特點的產(chǎn)品滿足不同的客戶場景。另一方面,ECS相關(guān)的技術(shù)爆炸也帶來了“百家爭鳴”的盛況:虛擬網(wǎng)絡(luò)團(tuán)隊重點推出了用戶可以定制的VPC網(wǎng)絡(luò);塊存儲團(tuán)隊推出高性能的SSD云盤和高性價比的混合SSD云盤,而ESSD云盤則實現(xiàn)了性價比和高性能的雌雄同體;虛擬化團(tuán)隊從最初的Xen全面遷移到KVM,同時推出了異構(gòu)計算GPU、FPGA虛擬化技術(shù),并開始自研新一代的彈性裸金屬云服務(wù)器(神龍)。如此多的新產(chǎn)品和新特性對接的是底層幾十種物理機(jī)型、多種網(wǎng)卡和網(wǎng)絡(luò)架構(gòu)、多種虛擬化方案和虛擬存儲以及多種版本的虛擬網(wǎng)絡(luò)。實現(xiàn)產(chǎn)品到資源的精準(zhǔn)調(diào)度,并最大化資源使用效率,這,就是信息時代下的后羿系統(tǒng)需要提供的基本能力。
在野蠻生長期,集群級的調(diào)度由上層業(yè)務(wù)層負(fù)責(zé)、集群內(nèi)的調(diào)度由后羿負(fù)責(zé),因為當(dāng)時每個集群部署一種業(yè)務(wù),團(tuán)隊的設(shè)置也是按這樣分兩層。但現(xiàn)在為了支撐豐富的產(chǎn)品形態(tài)和優(yōu)化庫存效率,同一集群內(nèi)的每個物理機(jī)都可能售賣不同的產(chǎn)品規(guī)格,原來那種分層的調(diào)度顯然已經(jīng)不合時宜了。我們進(jìn)行了一次合體手術(shù),重新定義了上下系統(tǒng)的職責(zé)分工,上層業(yè)務(wù)系統(tǒng)負(fù)責(zé)業(yè)務(wù)功能,下層后羿系統(tǒng)負(fù)責(zé)所有的調(diào)度相關(guān)邏輯。統(tǒng)一了調(diào)度邏輯,不僅僅大大提高了后羿的調(diào)度能力,同時可以讓調(diào)度技術(shù)驅(qū)動產(chǎn)生了更多豐富的產(chǎn)品形態(tài)。列舉下這個時期調(diào)度技術(shù)主要支撐的系統(tǒng)功能和產(chǎn)品:
彈無虛發(fā)-的精準(zhǔn)調(diào)度
后羿基于Tag標(biāo)簽對資源進(jìn)行分組和篩選,可在AZ大范圍內(nèi)實現(xiàn)精細(xì)的產(chǎn)品規(guī)格調(diào)度。豐富的權(quán)重因子,讓后羿可以在多個目標(biāo)下權(quán)衡出最優(yōu)的調(diào)度決策,最佳配比裝箱(最少碎片)那是最低要求,其他的隨便舉幾個例子:
Deployment Set:滿足用戶自定義的部署位置要求,例如物理機(jī)粒度打散幾個VM
資源消費打散:保障性能SLA,提升用戶體驗
客戶VM打散
機(jī)架功耗平衡
……
神機(jī)妙算的庫存精細(xì)管理
其實VM調(diào)度只是后羿的業(yè)務(wù)愛好,庫存管理才是后羿的本職工作。由于產(chǎn)品形態(tài)的多樣性,同一個地域同一個產(chǎn)品規(guī)格按不同付費類型、不同的付費時間計算出來的庫存數(shù)據(jù)都是不同的!很多人知道電商的必殺技之一就是庫存和供應(yīng)鏈管理,后羿其實就是一個在網(wǎng)上賣VM的掌柜而已啦。他在背后可是耍了很多小聰明的:
庫存水位控制:保障每個可用區(qū)的每個產(chǎn)品的在接近斷供時可以保障剛需彈性擴(kuò)容和升級需求;
庫存共享:應(yīng)付多種產(chǎn)品的不時之需;
庫存預(yù)測:預(yù)測銷售并相應(yīng)地進(jìn)行庫存調(diào)配
賣跳樓價的競價實例
1折的跳樓價后羿掌柜也敢賣?!是的,他已經(jīng)賣好久了。這是一種叫競價實例的游戲,而在游戲中坐莊的正是后羿。說白了,他就是把那些暫時空在那里的資源拿出來臨時賣一下。為什么是”臨時“?因為后羿在庫存充裕時才賣競價實例,庫存緊張時就要收回去。但是回收實例也是有講究的,不是隨便回收的,比如要保證至少運行1小時,要提前5分鐘通知,如此等等。那為什么要競價?在資源緊張的地區(qū)多賣點錢?其實更重要的是跟庫存的聯(lián)動,是一種價格杠桿,讓客戶主動去選擇價格便宜庫存充足的地區(qū)和規(guī)格。這其實就是調(diào)度客戶,背后的道道其實真不少。
火中取栗的性能突發(fā)實例
競價實例雖價格便宜,量又足, 無奈的是因為它會被隨時中止釋放,所以適合的業(yè)務(wù)場景有限或者需要技術(shù)能力架構(gòu)適配才能愉快使用。 有沒有價格便宜,又不用擔(dān)心被釋放的高性價比實例類型呢?價格便宜、服務(wù)有保障的性能突發(fā)實例了解一下。這是后羿掌柜和ECS強(qiáng)大的虛擬化團(tuán)隊的一次高水平運作,可謂火中取栗。但在強(qiáng)大的技術(shù)保障下,后羿把一個物理線程掰成小片片拿出來賣,而且還能保障SLA。計算力在空閑時積攢人品(Credit),在需要突發(fā)計算力時來消費人品(Credit),未來還能拿錢來買Credit。
智能未來:演繹神話
未來的大門已然開啟,智能的時代已經(jīng)到來。在經(jīng)歷了野蠻生長和豐富功能的階段后,后羿步入了深水區(qū),需要更多的智慧和更廣闊的視野來精耕細(xì)作。云計算的核心競爭力之一就是性價比,后羿未來要做的就是數(shù)據(jù)驅(qū)動的全鏈路、精細(xì)化的庫存調(diào)配和調(diào)度一體化的大閉環(huán),并在各個環(huán)節(jié)上挖掘使用更智能的方法帶來的紅利,從數(shù)據(jù)的可視化、到運營的自動化到最后實現(xiàn)綜合的智能化。
后羿的故事還在繼續(xù)。伴隨著ECS業(yè)務(wù)的發(fā)展,風(fēng)風(fēng)雨雨的路上,我們眼里一路奇峰異景,執(zhí)著前進(jìn)!塊存儲、虛擬化、虛擬化網(wǎng)絡(luò)、ECS管控,一群有情有義的兄弟姐妹,一個凝聚力彪悍的團(tuán)隊。當(dāng)然,后羿是站在了巨人的肩膀上,他的成長離不開飛天云計算平臺強(qiáng)大的核心技術(shù)和阿里云各個產(chǎn)品的All-In支持!很慶幸在阿里集團(tuán),兄弟團(tuán)隊無私的合作和幫助,能讓后羿未來真正可以成為一個業(yè)界的神話。
原文鏈接
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/25229.html
摘要:據(jù)悉,高清直播已在阿里云的眾多游戲直播客戶中廣泛使用。這也是阿里云視頻云第四年支持雙貓晚網(wǎng)絡(luò)直播,從作戰(zhàn)室監(jiān)控的數(shù)據(jù)上來看,貓晚直播期間各項系統(tǒng)數(shù)據(jù)指標(biāo)運轉(zhuǎn)平穩(wěn),一場穩(wěn)定高清流暢的大型活動直播就就此實現(xiàn)。 雙11貓晚是家喻戶曉的綜藝晚會,在今年的雙11,阿里集團(tuán)為2500萬用戶提供了一場在線直播視覺盛宴。網(wǎng)友評價這是一場既穩(wěn)定流暢又高清的直播,當(dāng)然在這背后離不開阿里云的技術(shù)支持。 本次...
摘要:日前,阿里云宣布正式推出阿里云專有宿主機(jī)服務(wù),專有宿主機(jī)是一個基于阿里云虛擬化技術(shù)托管的用戶獨享物理服務(wù)器,通過向用戶出售整體物理主機(jī)的資源,物理獨享的單租戶環(huán)境。 摘要: 阿里云專有宿主機(jī)為什么能夠成為公共云上的專有資源池 過去幾年,云服務(wù)深刻的改變了社會獲取和使用計算能力的方式,云已經(jīng)逐漸演變成水電一樣的基礎(chǔ)服務(wù),越來越多用戶逐步遷移上公有云,有很多客戶從自有機(jī)房遷移上公有云都...
摘要:阿里云基因數(shù)據(jù)服務(wù)不斷提升極致彈性的計算能力,和大規(guī)模并行處理能力,以及海量高速存儲來幫助基因公司快速自動化處理每天幾十上百的下機(jī)數(shù)據(jù),并產(chǎn)通過標(biāo)準(zhǔn)產(chǎn)出高質(zhì)量的變異數(shù)據(jù)。 摘要:?一家大型基因測序功能公司每日會產(chǎn)生 10TB 到 100TB 的下機(jī)數(shù)據(jù),大數(shù)據(jù)生信分析平臺需要達(dá)到 PB 級別的數(shù)據(jù)處理能力。這背后是生物科技和計算機(jī)科技的雙向支撐:測序應(yīng)用從科研逐步走向臨床應(yīng)用,計算模...
摘要:它讓傳統(tǒng)的測試工程師從簡單,重復(fù),低效可替代性強(qiáng)的手工測試,變成了有技術(shù)難度和門檻的測試開發(fā)工作,也讓我們有更多的機(jī)會拿到更高的薪資。 隨著互聯(lián)網(wǎng)行業(yè)的迅速發(fā)展,軟件測試工程師的地位越來越高,公司招聘時的薪資也越來越高,那么市場上為什么還有大量的軟件測試工程師薪資只有5-6k呢?因為他們有一...
閱讀 2771·2023-04-25 17:21
閱讀 2623·2021-11-23 09:51
閱讀 2933·2021-09-24 10:32
閱讀 3892·2021-09-23 11:33
閱讀 2034·2019-08-30 15:44
閱讀 3516·2019-08-30 11:18
閱讀 3622·2019-08-30 10:53
閱讀 697·2019-08-26 13:25