摘要:宋體在這場(chǎng)戰(zhàn)疫中,快杰云主機(jī)歷經(jīng)了多項(xiàng)考驗(yàn),在計(jì)算網(wǎng)絡(luò)存儲(chǔ)各方面均具備優(yōu)異性能。宋體宋體宋體快杰云主機(jī)的優(yōu)異表現(xiàn)依托于產(chǎn)品的技術(shù)優(yōu)化,來看一組快杰云主機(jī)的配置參數(shù)搭載最新硬盤網(wǎng)絡(luò),并通過最新的智能網(wǎng)卡提供硬件卸載。
新冠肺炎催生了辦公、醫(yī)療、教育等行業(yè)的“線上解決”,加速了各行業(yè)與“云”的結(jié)合,也對(duì)不少服務(wù)企業(yè)提出了新的考驗(yàn):持續(xù)攀登的高并發(fā)、多連接,需要更加高性能穩(wěn)定的云平臺(tái)支撐,確保不宕機(jī)、不卡斷以及流暢穩(wěn)定的云上體驗(yàn)。
在這場(chǎng)戰(zhàn)“疫”中,UCloud快杰云主機(jī)歷經(jīng)了多項(xiàng)考驗(yàn),在計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)各方面均具備優(yōu)異性能。其中,為了響應(yīng)“停課不停學(xué)”的號(hào)召,快杰云主機(jī)為小禾科技線上教育直播平臺(tái)提供了高性能穩(wěn)定的云資源支持,同時(shí)UCloud還免費(fèi)提供直播帶寬和流量等資源,保障高并發(fā)場(chǎng)景下直播平臺(tái)及課程的順利進(jìn)行。
?
快杰云主機(jī)的優(yōu)異表現(xiàn)依托于產(chǎn)品的技術(shù)優(yōu)化,來看一組快杰云主機(jī)的配置參數(shù):搭載Intel最新Cascade Lake CPU、NVMe SSD硬盤、25G RDMA網(wǎng)絡(luò),并通過最新的智能網(wǎng)卡提供硬件卸載。 在這其中,每一項(xiàng)參數(shù)優(yōu)化均經(jīng)歷了諸多思路重建、革舊換新的技術(shù)更迭。
下面我們就來聊聊快杰云主機(jī)的“破局”之路。
一、存儲(chǔ)“破局”
快杰云主機(jī)搭載的NVMe SSD硬盤,采用64層3DNAND,支持8TB/s高速TRIM。支持性能出色的同時(shí),NVMe SSD硬盤通過動(dòng)態(tài)精確能耗控制,能源效率也比前代提升38%。
國(guó)內(nèi)專業(yè)云資源選型服務(wù)平臺(tái) CloudBest 實(shí)驗(yàn)室的報(bào)告中(阿里云、騰訊云、UCloud 、華為云云主機(jī)對(duì)比測(cè)試報(bào)告 ),關(guān)于“磁盤性能” 的測(cè)試結(jié)果如下:
圖:隊(duì)列深度7*16的【隨機(jī)讀寫】&【平均時(shí)延】
可以看到,快杰云主機(jī)的I/O讀寫能力對(duì)比其他云廠商最高可達(dá)到10倍 的差距,平均時(shí)延可降低近6倍 ,磁盤性能的優(yōu)勢(shì)非常出眾。
磁盤性能對(duì)于云主機(jī)來講是非常重要的一個(gè)參數(shù),快杰云主機(jī)在云盤優(yōu)化方面做了很多工作,我們將這些工作用六個(gè)字來總結(jié):要致富、先修路。
1、更高效的存儲(chǔ)架構(gòu):NVMe筑基
要修路,先筑基。從泥濘路徑到柏油馬路,決定的是道路的基礎(chǔ)質(zhì)量保障,并且基礎(chǔ)架構(gòu)設(shè)施的質(zhì)量提升足以促進(jìn)產(chǎn)品性能產(chǎn)生大幅度的飛躍。
同理,在快杰云主機(jī)云硬盤的基礎(chǔ)架構(gòu)上,采用的便是行業(yè)內(nèi)最優(yōu)的NVMe存儲(chǔ)架構(gòu) 。
與傳統(tǒng)的SATA架構(gòu)不同的是,NVMe傳輸協(xié)議在誕生之初就充分利用了PCIe SSD的低延時(shí)以及并行性優(yōu)勢(shì),成為計(jì)算存儲(chǔ)行業(yè)的大熱趨勢(shì)。
NVMe SSD比SATA快在哪里呢?舉個(gè)例子,市面上性能不錯(cuò)的SATA SSD,在隊(duì)列深度上可以達(dá)到32,然而這也是AHCI所能做到的極限罷了。而PCIe SSD下的隊(duì)列深度則需達(dá)到128,甚至是256才能夠發(fā)揮出最高的IOPS性能,NVMe解決了這個(gè)問題——在NVMe下,最大的隊(duì)列深度可達(dá)64K,此外,NVMe的隊(duì)列數(shù)量也從AHCI的1提高到了64K。
圖:NVME&AHCI隊(duì)列深度對(duì)比
同時(shí),PCIe主控與CPU直接相連,對(duì)比SATA主控通過控制器中轉(zhuǎn)再連接CPU的方式, PCIe SSD因此具備更低的時(shí)延。可以看到,對(duì)比SATA,PCIe接口本身在性能上具備更高的優(yōu)勢(shì),再加上NVMe具有比AHCI更深、更寬的命令隊(duì)列,NVMe SSD成為行業(yè)技術(shù)大勢(shì)也就不足為奇了。
這便是快杰云主機(jī)云盤優(yōu)化工作的第一步,NVME筑基。
2、 更寬闊的通信道路:25G以太網(wǎng)加速
道路基礎(chǔ)修建好后,還有一個(gè)問題:如何最大化地提升道路通行速率呢?從單行道變?yōu)榘塑嚨澜^對(duì)是捷徑之一。
同樣,在快杰云主機(jī)云盤優(yōu)化的工作中,我們采用了25G以太網(wǎng)絡(luò)替代傳統(tǒng)10G以太網(wǎng),大大提升了存儲(chǔ)數(shù)據(jù)傳輸?shù)乃俾省?/strong>
目前大部分?jǐn)?shù)據(jù)中心主要是基于10G以太網(wǎng)架構(gòu),隨著互聯(lián)網(wǎng)下數(shù)據(jù)的爆發(fā)式增長(zhǎng),數(shù)據(jù)中心必須通過增加與現(xiàn)有基礎(chǔ)設(shè)施并行的帶寬能力實(shí)現(xiàn)擴(kuò)展,從而有能力處理不斷增大的數(shù)據(jù)負(fù)載。而25G便是下一代數(shù)據(jù)中心網(wǎng)絡(luò)帶寬和信道容量擴(kuò)展的新方向。
相比10G,25G以太網(wǎng)具有增強(qiáng)計(jì)算和存儲(chǔ)效率的優(yōu)點(diǎn),能夠提供帶寬更高、速度更快的連接,我們可以把它看做加速2.5倍的10G以太網(wǎng) 。此外,可以運(yùn)行兩個(gè)25G通道實(shí)現(xiàn)50G,或運(yùn)行四個(gè)通道實(shí)現(xiàn)100G,并且25G完全兼容10G以太網(wǎng)的相關(guān)物理標(biāo)準(zhǔn),可以實(shí)現(xiàn)新舊應(yīng)用的平滑遷移。
圖:25G以太網(wǎng)&10G以太網(wǎng)對(duì)比
25G以太網(wǎng)之于10G以太網(wǎng)便是單行道到八車道的飛躍,網(wǎng)絡(luò)帶寬能力的大幅提升幫助快杰云主機(jī)實(shí)現(xiàn)數(shù)據(jù)傳輸?shù)募铀?,從而助力磁盤性能提升。
3、更輕量級(jí)的傳輸路徑:RDMA降低延遲
近兩年國(guó)家大力普及高速公路ETC取代傳統(tǒng)的人工收費(fèi)站模式,司機(jī)無需停車便可實(shí)現(xiàn)快速感應(yīng)過車。與傳統(tǒng)收費(fèi)模式相比,ETC耗時(shí)不到兩秒,通行能力是人工收費(fèi)通道的5至10倍??梢灶A(yù)見到,一輛車可提高5-10倍的效率,那么對(duì)整條高速路而言,就會(huì)是極大的通行速率提升。
我們這里說到的RDMA便具備類似的功能。 RDMA是一類通信協(xié)議,也是近幾年在云計(jì)算/大數(shù)據(jù)領(lǐng)域非?;鸬囊豁?xiàng)新技術(shù),它的全稱為遠(yuǎn)程直接數(shù)據(jù)存取,就是為了解決網(wǎng)絡(luò)傳輸中服務(wù)器端數(shù)據(jù)處理的延遲而產(chǎn)生的。
在詳細(xì)介紹RDMA功能之前,先來了解下傳統(tǒng)TCP/IP通信模式的瓶頸。
傳統(tǒng)的TCP/IP網(wǎng)絡(luò)通信通過內(nèi)核發(fā)送/接收消息 ,數(shù)據(jù)發(fā)送方需要將數(shù)據(jù)從用戶應(yīng)用空間Buffer拷貝到內(nèi)核空間的Socket Buffer中,并在內(nèi)核空間中進(jìn)行添加數(shù)據(jù)包頭、數(shù)據(jù)封裝等一系列操作。同樣,數(shù)據(jù)接收方也需要在內(nèi)核進(jìn)行大量數(shù)據(jù)包解析工作,并第二次拷貝到相應(yīng)位置的用戶空間Buffer。
圖:TCP/IP&RDMA傳輸原理對(duì)比示意
在這樣復(fù)雜的傳輸過程中,內(nèi)核承擔(dān)了極大的壓力,一旦遇到大量數(shù)據(jù)傳輸?shù)那闆r,勢(shì)必會(huì)造成硬盤I/O讀寫能力的延遲。
RDMA則通過網(wǎng)絡(luò)把資料直接傳入計(jì)算機(jī)的存儲(chǔ)區(qū),將數(shù)據(jù)從一個(gè)系統(tǒng)快速移動(dòng)到遠(yuǎn)程系統(tǒng)存儲(chǔ)器中,不會(huì)對(duì)內(nèi)核造成太大影響。RDMA消除了外部存儲(chǔ)器復(fù)制和上下文切換的開銷,因而能解放內(nèi)存帶寬和CPU周期用于改進(jìn)應(yīng)用系統(tǒng)性能。RDMA作為快杰云主機(jī)后端存儲(chǔ)的通信協(xié)議,實(shí)現(xiàn)收發(fā)包卸載到硬件,使得RSSD云盤的延遲降低到0.1毫秒, 從而大幅度降低數(shù)據(jù)處理的延時(shí)。
簡(jiǎn)單來講,RDMA好比是ETC,省去了停車、溝通、繳費(fèi)等復(fù)雜的步驟,避免成為數(shù)據(jù)傳輸中的瓶頸,形成一個(gè)更輕量級(jí)的傳輸路徑。
除此之外,針對(duì)虛擬化IO路徑的性能瓶頸問題,我們使用SPDK VHost代替QEMU,實(shí)現(xiàn)虛機(jī)到存儲(chǔ)客戶端的數(shù)據(jù)零拷貝;在存儲(chǔ)引擎方面由SPDK代替libaio,高并發(fā)場(chǎng)景下依然可以保持較低的時(shí)延。
總的來說,通過一系列技術(shù)革新手段,使得快杰云主機(jī)NVMe-SSD云盤的磁盤性能達(dá)到最佳狀態(tài)。
二、網(wǎng)絡(luò)增強(qiáng)2.0的“破局”
當(dāng)我們搭建好一個(gè)超高性能的云硬盤,云主機(jī)的優(yōu)化工作就結(jié)束了嗎?
答案是,遠(yuǎn)遠(yuǎn)不夠。事實(shí)上,此時(shí)還會(huì)出現(xiàn)一個(gè)問題,那就是云主機(jī)日益增長(zhǎng)的高性能需求與落后的核心配置之間的矛盾。
而這個(gè)矛盾就是由傳統(tǒng)的內(nèi)核CPU處理模式所帶來的。
1、CPU的局限性
早期,服務(wù)器的功能較為簡(jiǎn)單,需要處理的數(shù)據(jù)運(yùn)算量也不大,因而所有的應(yīng)用處理均是由CPU內(nèi)核完成的,此時(shí)的CPU作為核心大腦是綽綽有余的。
但是,隨著云計(jì)算和大數(shù)據(jù)時(shí)代的來臨,云主機(jī)的計(jì)算需求越來越高。舉個(gè)例子,云主機(jī)會(huì)附加VNF的安全功能,而此類安全應(yīng)用的處理與網(wǎng)絡(luò)傳輸不同的是,往往需要將數(shù)據(jù)包一一拆開做解析,對(duì)CPU的處理能力帶來極大的負(fù)擔(dān)。這時(shí)的CPU可以看作是拆東墻、補(bǔ)西墻 的狀態(tài),計(jì)算能力的大幅度消耗,勢(shì)必會(huì)帶來對(duì)其他應(yīng)用的效率影響,從而造成云主機(jī)整體性能的下降。
在這樣的背景下,網(wǎng)絡(luò)與計(jì)算的高效融合勢(shì)在必行。
2、網(wǎng)絡(luò)增強(qiáng)2.0:基于OpenvSwitch卸載的智能網(wǎng)卡方案
一開始,為了解決云主機(jī)的計(jì)算性能問題,產(chǎn)生了TOE技術(shù) (TCP offload engine),即將TCP連接過程中的相關(guān)計(jì)算工作轉(zhuǎn)移到專用硬件上,從而釋放CPU資源,而這個(gè)專用硬件就是早先的普通網(wǎng)卡。
不過,隨著Iaas的云計(jì)算服務(wù)模式出現(xiàn),云主機(jī)需要承擔(dān)更豐富的網(wǎng)絡(luò)功能來滿足云租戶的需求,例如任意配置IP的虛擬私有網(wǎng)絡(luò)、可擴(kuò)展的4層負(fù)載均衡器、訪問控制列表等等。這便意味著網(wǎng)卡需要具備更高性能以備網(wǎng)絡(luò)性能的增強(qiáng)。
此時(shí),
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/117617.html