摘要:?jiǎn)栴}分析及解決方案服務(wù)端一般會(huì)保持很多個(gè)連接,所以,一般是創(chuàng)建一個(gè)定時(shí)器,定時(shí)檢查所有連接中哪些連接超時(shí)了。
問題描述
在C/S模式中,有時(shí)我們會(huì)長(zhǎng)時(shí)間保持一個(gè)連接,以避免頻繁地建立連接,但同時(shí),一般會(huì)有一個(gè)超時(shí)時(shí)間,在這個(gè)時(shí)間內(nèi)沒發(fā)起任何請(qǐng)求的連接會(huì)被斷開,以減少負(fù)載,節(jié)約資源。并且該機(jī)制一般都是在服務(wù)端實(shí)現(xiàn),因?yàn)閏lient強(qiáng)制關(guān)閉或意外斷開連接,server端在此刻是感知不到的,如果放到client端實(shí)現(xiàn),在上述情況下,該超時(shí)機(jī)制就失效了。本來這問題很普通,不太值得一提,但最近在項(xiàng)目中看到了該機(jī)制的一種糟糕的實(shí)現(xiàn),故在此深入分析一下。
問題分析及解決方案服務(wù)端一般會(huì)保持很多個(gè)連接,所以,一般是創(chuàng)建一個(gè)定時(shí)器,定時(shí)檢查所有連接中哪些連接超時(shí)了。此外我們要做的是,當(dāng)收到客戶端發(fā)來的數(shù)據(jù)時(shí),怎么去刷新該連接的超時(shí)信息?
最近看到一種實(shí)現(xiàn)方式是這樣做的:
public class Connection { private long lastTime; public void refresh() { lastTime = System.currentTimeMillis(); } public long getLastTime() { return lastTime; } //...... }
在每次收到客戶端發(fā)來的數(shù)據(jù)時(shí),調(diào)用refresh方法。
然后在定時(shí)器里,用當(dāng)前時(shí)間跟每個(gè)連接的getLastTime()作比較,來判定超時(shí):
public class TimeoutTask extends TimerTask{ public void run() { long now = System.currentTimeMillis(); for(Connection c: connections){ if(now - c.getLastTime()> TIMEOUT_THRESHOLD) ;//timeout, do something } } }
看到這,可能不少讀者已經(jīng)看出問題來了,那就是內(nèi)存可見性問題,調(diào)用refresh方法的線程跟執(zhí)行定時(shí)器的線程肯定不是一個(gè)線程,那run方法中讀到的lastTime就可能是舊值,即可能將活躍的連接判定超時(shí),然后被干掉。
有讀者此時(shí)可能想到了這樣一個(gè)方法,將lastTime加個(gè)volatile修飾,是的,這樣確實(shí)解決了問題,不過,作為服務(wù)端,很多時(shí)候?qū)π阅苁怯幸蟮?,下面來看下在我電腦上測(cè)出的一組數(shù)據(jù),測(cè)試代碼如下,供參考
public class PerformanceTest { private static long i; private volatile static long vt; private static final int TEST_SIZE = 10000000; public static void main(String[] args) { long time = System.nanoTime(); for (int n = 0; n < TEST_SIZE; n++) vt = System.currentTimeMillis(); System.out.println(-time + (time = System.nanoTime())); for (int n = 0; n < TEST_SIZE; n++) i = System.currentTimeMillis(); System.out.println(-time + (time = System.nanoTime())); for (int n = 0; n < TEST_SIZE; n++) synchronized (PerformanceTest.class) { } System.out.println(-time + (time = System.nanoTime())); for (int n = 0; n < TEST_SIZE; n++) vt++; System.out.println(-time + (time = System.nanoTime())); for (int n = 0; n < TEST_SIZE; n++) vt = i; System.out.println(-time + (time = System.nanoTime())); for (int n = 0; n < TEST_SIZE; n++) i = vt; System.out.println(-time + (time = System.nanoTime())); for (int n = 0; n < TEST_SIZE; n++) i++; System.out.println(-time + (time = System.nanoTime())); for (int n = 0; n < TEST_SIZE; n++) i = n; System.out.println(-time + (time = System.nanoTime())); } }
測(cè)試一千萬次,結(jié)果是(耗時(shí)單位:納秒,包含循環(huán)本身的時(shí)間):
238932949 volatile寫+取系統(tǒng)時(shí)間
144317590 普通寫+取系統(tǒng)時(shí)間
135596135 空的同步塊(synchronized)
80042382 volatile變量自增
15875140 volatile寫
6548994 volatile讀
2722555 普通自增
2949571 普通讀寫
從上面的數(shù)據(jù)看來,volatile寫+取系統(tǒng)時(shí)間的耗時(shí)是很高的,取系統(tǒng)時(shí)間的耗時(shí)也比較高,跟一次無競(jìng)爭(zhēng)的同步差不多了,接下來分析下如何優(yōu)化該超時(shí)時(shí)機(jī)。
首先:同步問題是肯定得考慮的,因?yàn)橛锌缇€程的數(shù)據(jù)操作;另外,取系統(tǒng)時(shí)間的操作比較耗時(shí),能否不在每次刷新時(shí)都取時(shí)間?因?yàn)樗⑿抡{(diào)用在高負(fù)載的情況下很頻繁。如果不在刷新時(shí)取時(shí)間,那又該怎么去判定超時(shí)?
我想到的辦法是,在refresh方法里,僅設(shè)置一個(gè)volatile的boolean變量reset(這應(yīng)該是成本最小的了吧,因?yàn)橐幚硗絾栴},要么同步塊,要么volatile,而volatile讀在此處是沒什么意義的),對(duì)時(shí)間的掌控交給定時(shí)器來做,并為每個(gè)連接維護(hù)一個(gè)計(jì)數(shù)器,每次加一,如果reset被設(shè)置為true了,則計(jì)數(shù)器歸零,并將reset設(shè)為false(因?yàn)橛?jì)數(shù)器只由定時(shí)器維護(hù),所以不需要做同步處理,從上面的測(cè)試數(shù)據(jù)來看,普通變量的操作,時(shí)間成本是很低的),如果計(jì)數(shù)器超過某個(gè)值,則判定超時(shí)。 下面給出具體的代碼:
public class Connection { int count = 0; volatile boolean reset = false; public void refresh() { if (reset == false) reset = true; } } public class TimeoutTask extends TimerTask { public void run() { for (Connection c : connections) { if (c.reset) { c.reset = false; c.count = 0; } else if (++c.count >= TIMEOUT_COUNT) ;// timeout, do something } } }
代碼中的TIMEOUT_COUNT 等于超時(shí)時(shí)間除以定時(shí)器的周期,周期大小既影響定時(shí)器的執(zhí)行頻率,也會(huì)影響實(shí)際超時(shí)時(shí)間的波動(dòng)范圍(這個(gè)波動(dòng),第一個(gè)方案也存在,也不太可能避免,并且也不需要多么精確)。
代碼很簡(jiǎn)潔,下面來分析一下。
reset加上了volatile,所以保證了多線程操作的可見性,雖然有兩個(gè)線程都對(duì)變量有寫操作,但無論這兩個(gè)線程怎么穿插執(zhí)行,都不會(huì)影響其邏輯含義。
再說下refresh方法,為什么我在賦值語句上多加了個(gè)條件?這不是多了一次volatile讀操作嗎?我是這么考慮的,高負(fù)載下,refresh會(huì)被頻繁調(diào)用,意味著reset長(zhǎng)時(shí)間為true,那么加上條件后,就不會(huì)執(zhí)行寫操作了,只有一次讀操作,從上面的測(cè)試數(shù)據(jù)來看,volatile變量的讀操作的性能是顯著優(yōu)于寫操作的。只不過在reset為false的時(shí)候,多了一次讀操作,但此情況在定時(shí)器的一個(gè)周期內(nèi)最多只會(huì)發(fā)一次,而且對(duì)高負(fù)載情況下的優(yōu)化顯然更有意義,所以我認(rèn)為加上條件還是值得的。
最后提及一下,我有點(diǎn)完美主義,自認(rèn)為上面的方案在我當(dāng)前掌握的知識(shí)下,已經(jīng)很漂亮了,如果你發(fā)現(xiàn)還有可優(yōu)化的地方,或更好的方案,希望能分享。
via ifeve
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/69761.html
摘要:基礎(chǔ)何為心跳顧名思義所謂心跳即在長(zhǎng)連接中客戶端和服務(wù)器之間定期發(fā)送的一種特殊的數(shù)據(jù)包通知對(duì)方自己還在線以確保連接的有效性為什么需要心跳因?yàn)榫W(wǎng)絡(luò)的不可靠性有可能在保持長(zhǎng)連接的過程中由于某些突發(fā)情況例如網(wǎng)線被拔出突然掉電等會(huì)造成服務(wù)器和客戶端的 基礎(chǔ) 何為心跳 顧名思義, 所謂 心跳, 即在 TCP 長(zhǎng)連接中, 客戶端和服務(wù)器之間定期發(fā)送的一種特殊的數(shù)據(jù)包, 通知對(duì)方自己還在線, 以確保 ...
摘要:和斷開,處理措施不一樣,會(huì)分別做出重連和關(guān)閉通道的操作。取消定時(shí)器取消大量已排隊(duì)任務(wù),用于回收空間該方法是停止現(xiàn)有心跳,也就是停止定時(shí)器,釋放空間。做到異步處理返回結(jié)果時(shí)能給準(zhǔn)確的返回給對(duì)應(yīng)的請(qǐng)求。 遠(yuǎn)程通訊——Exchange層 目標(biāo):介紹Exchange層的相關(guān)設(shè)計(jì)和邏輯、介紹dubbo-remoting-api中的exchange包內(nèi)的源碼解析。 前言 上一篇文章我講的是dubb...
摘要:比如面向連接的功能包發(fā)送接收數(shù)量包發(fā)送接收速率錯(cuò)誤計(jì)數(shù)連接重連次數(shù)調(diào)用延遲連接狀態(tài)等。你要處理的,就是心跳超時(shí)的邏輯,比如延遲重連。發(fā)生異常后,可以根據(jù)不同的類型選擇斷線重連比如一些二進(jìn)制協(xié)議的編解碼紊亂問題,或者調(diào)度到其他節(jié)點(diǎn)。 在java界,netty無疑是開發(fā)網(wǎng)絡(luò)應(yīng)用的拿手菜。你不需要太多關(guān)注復(fù)雜的nio模型和底層網(wǎng)絡(luò)的細(xì)節(jié),使用其豐富的接口,可以很容易的實(shí)現(xiàn)復(fù)雜的通訊功能。 和...
閱讀 1239·2023-04-25 17:28
閱讀 3908·2021-10-14 09:43
閱讀 4202·2021-10-09 10:02
閱讀 2009·2019-08-30 14:04
閱讀 3200·2019-08-30 13:09
閱讀 3332·2019-08-30 12:53
閱讀 2980·2019-08-29 17:11
閱讀 1878·2019-08-29 16:58