摘要:盡可能避免使用,會(huì)導(dǎo)致復(fù)制數(shù)組,降低效率。再額外提一點(diǎn),我們常用的另一個(gè)容器也是推薦要初始化長(zhǎng)度從而避免擴(kuò)容。
前言
前不久幫同事一起 review 一個(gè) job 執(zhí)行緩慢的問(wèn)題時(shí)發(fā)現(xiàn)不少朋友在擼碼實(shí)現(xiàn)功能時(shí)還是有需要細(xì)節(jié)不夠注意,于是便有了這篇文章。
ArrayList 踩坑Listtemp = new ArrayList() ; //獲取一批數(shù)據(jù) List all = getData(); for(String str : all) { temp.add(str); }
首先大家看看這段代碼有什么問(wèn)題嘛?
其實(shí)在大部分情況下這都是沒(méi)啥問(wèn)題,無(wú)非就是循環(huán)的往 ArrayList 中寫入數(shù)據(jù)而已。
但在特殊情況下,比如這里的 getData() 返回?cái)?shù)據(jù)非常巨大時(shí)后續(xù) temp.add(str) 就會(huì)有問(wèn)題了。
比如我們?cè)?review 代碼時(shí)發(fā)現(xiàn)這里返回的數(shù)據(jù)有時(shí)會(huì)高達(dá) 2000W,這時(shí) ArrayList 寫入的問(wèn)題就凸顯出來(lái)了。
填坑指南大家都知道 ArrayList 是由數(shù)組實(shí)現(xiàn),而數(shù)據(jù)的長(zhǎng)度有限;需要在合適的時(shí)機(jī)對(duì)數(shù)組擴(kuò)容。
這里以插入到尾部為例 add(E e)。
ArrayListtemp = new ArrayList<>(2) ; temp.add("1"); temp.add("2"); temp.add("3");
當(dāng)我們初始化一個(gè)長(zhǎng)度為 2 的 ArrayList ,并往里邊寫入三條數(shù)據(jù)時(shí) ArrayList 就得擴(kuò)容了,也就是將之前的數(shù)據(jù)復(fù)制一份到新的數(shù)組長(zhǎng)度為 3 的數(shù)組中。
之所以是 3 ,是因?yàn)樾碌拈L(zhǎng)度=原有長(zhǎng)度 * 1.5
通過(guò)源碼我們可以得知 ArrayList 的默認(rèn)長(zhǎng)度為 10.
但其實(shí)并不是在初始化的時(shí)候就創(chuàng)建了 DEFAULT_CAPACITY = 10 的數(shù)組。
而是在往里邊 add 第一個(gè)數(shù)據(jù)的時(shí)候會(huì)擴(kuò)容到 10.
既然知道了默認(rèn)的長(zhǎng)度為 10 ,那說(shuō)明后續(xù)一旦寫入到第九個(gè)元素的時(shí)候就會(huì)擴(kuò)容為 10*1.5 =15。
這一步為數(shù)組復(fù)制,也就是要重新開(kāi)辟一塊新的內(nèi)存空間存放這 15 個(gè)數(shù)組。
一旦我們頻繁且數(shù)量巨大的進(jìn)行寫入時(shí)就會(huì)導(dǎo)致許多的數(shù)組復(fù)制,這個(gè)效率是極低的。
但如果我們提前預(yù)知了可能會(huì)寫入多少條數(shù)據(jù)時(shí)就可以提前避免這個(gè)問(wèn)題。
比如我們往里邊寫入 1000W 條數(shù)據(jù),在初始化的時(shí)候就給定數(shù)組長(zhǎng)度與用默認(rèn) 10 的長(zhǎng)度之間性能是差距巨大的。
我用 JMH 基準(zhǔn)測(cè)試驗(yàn)證如下:
@Warmup(iterations = 5, time = 1, timeUnit = TimeUnit.SECONDS) @Measurement(iterations = 5, time = 1, timeUnit = TimeUnit.SECONDS) public class CollectionsTest { private static final int TEN_MILLION = 10000000; @Benchmark @BenchmarkMode(Mode.AverageTime) @OutputTimeUnit(TimeUnit.MICROSECONDS) public void arrayList() { Listarray = new ArrayList<>(); for (int i = 0; i < TEN_MILLION; i++) { array.add("123"); } } @Benchmark @BenchmarkMode(Mode.AverageTime) @OutputTimeUnit(TimeUnit.MICROSECONDS) public void arrayListSize() { List array = new ArrayList<>(TEN_MILLION); for (int i = 0; i < TEN_MILLION; i++) { array.add("123"); } } public static void main(String[] args) throws RunnerException { Options opt = new OptionsBuilder() .include(CollectionsTest.class.getSimpleName()) .forks(1) .build(); new Runner(opt).run(); } }
根據(jù)結(jié)果可以看出預(yù)設(shè)長(zhǎng)度的效率會(huì)比用默認(rèn)的效率高上很多(這里的 Score 指執(zhí)行完函數(shù)所消耗的時(shí)間)。
所以這里強(qiáng)烈建議大家:在有大量數(shù)據(jù)寫入 ArrayList 時(shí),一定要初始化指定長(zhǎng)度。
再一個(gè)是一定要慎用 add(int index, E element) 向指定位置寫入數(shù)據(jù)。
通過(guò)源碼我們可以看出,每一次寫入都會(huì)將 index 后的數(shù)據(jù)往后移動(dòng)一遍,其實(shí)本質(zhì)也是要復(fù)制數(shù)組;
但區(qū)別于往常規(guī)的往數(shù)組尾部寫入數(shù)據(jù),它每次都會(huì)進(jìn)行數(shù)組復(fù)制,效率極低。
LinkedList提到 ArrayList 就不得不聊下 LinkedList 這個(gè)孿生兄弟;雖說(shuō)都是 List 的容器,但本質(zhì)實(shí)現(xiàn)卻完全不同。
LinkedList 是由鏈表組成,每個(gè)節(jié)點(diǎn)又有頭尾兩個(gè)節(jié)點(diǎn)分別引用了前后兩個(gè)節(jié)點(diǎn);因此它也是一個(gè)雙向鏈表。
所以理論上來(lái)說(shuō)它的寫入非常高效,將不會(huì)有 ArrayList 中效率極低的數(shù)組復(fù)制,每次只需要移動(dòng)指針即可。
這里偷懶就不畫圖了,大家自行腦補(bǔ)下。對(duì)比測(cè)試
坊間一直流傳:
LinkedList 的寫入效率高于 ArrayList,所以在寫大于讀的時(shí)候非常適用于 LinkedList 。
@Benchmark @BenchmarkMode(Mode.AverageTime) @OutputTimeUnit(TimeUnit.MICROSECONDS) public void linkedList() { Listarray = new LinkedList<>(); for (int i = 0; i < TEN_MILLION; i++) { array.add("123"); } }
這里測(cè)試看下結(jié)論是否符合;同樣的也是對(duì) LinkedList 寫入 1000W 次數(shù)據(jù),通過(guò)結(jié)果來(lái)看初始化數(shù)組長(zhǎng)度的 ArrayList 效率明顯是要高于 LinkedList 。
但這里的前提是要提前預(yù)設(shè) ArrayList 的數(shù)組長(zhǎng)度,避免數(shù)組擴(kuò)容,這樣 ArrayList 的寫入效率是非常高的,而 LinkedList 的雖然不需要復(fù)制內(nèi)存,但卻需要?jiǎng)?chuàng)建對(duì)象,變換指針等操作。
而查詢就不用多說(shuō)了,ArrayList 可以支持下標(biāo)隨機(jī)訪問(wèn),效率非常高。
LinkedList 由于底層不是數(shù)組,不支持通過(guò)下標(biāo)訪問(wèn),而是需要根據(jù)查詢 index 所在的位置來(lái)判斷是從頭還是從尾進(jìn)行遍歷。
但不管是哪種都得需要移動(dòng)指針來(lái)一個(gè)個(gè)遍歷,特別是 index 靠近中間位置時(shí)將會(huì)非常慢。
總結(jié)高性能應(yīng)用都是從小細(xì)節(jié)一點(diǎn)點(diǎn)堆砌起來(lái)的,就如這里提到的 ArrayList 的坑一樣,日常使用沒(méi)啥大問(wèn)題,一旦數(shù)據(jù)量起來(lái)所有的小問(wèn)題都會(huì)成為大問(wèn)題。
所以再總結(jié)下:
再使用 ArrayList 時(shí)如果能提前預(yù)測(cè)到數(shù)據(jù)量大小,比較大時(shí)一定要指定其長(zhǎng)度。
盡可能避免使用 add(index,e) api,會(huì)導(dǎo)致復(fù)制數(shù)組,降低效率。
再額外提一點(diǎn),我們常用的另一個(gè) Map 容器 HashMap 也是推薦要初始化長(zhǎng)度從而避免擴(kuò)容。
本文所有測(cè)試代碼:
https://github.com/crossoverJie/JCSprout/blob/master/src/main/java/com/crossoverjie/basic/CollectionsTest.java
你的點(diǎn)贊與分享是對(duì)我最大的支持
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/75161.html
摘要:第二具備輕量化特性容器的體積非常小巧。他們大多認(rèn)為自己應(yīng)該將應(yīng)用程序部署至當(dāng)前正在運(yùn)行的容器當(dāng)中。不要?jiǎng)?chuàng)建大型鏡像體積過(guò)大的鏡像會(huì)加大其發(fā)布難度??傮w來(lái)講,在向生產(chǎn)環(huán)境中部署容器時(shí),必須避免使用最新標(biāo)簽。 當(dāng)下最火爆的Docker,是一個(gè)開(kāi)源的應(yīng)用容器引擎。大家已經(jīng)開(kāi)始認(rèn)同并接受容器技術(shù),并意識(shí)到它能夠解決多種現(xiàn)實(shí)問(wèn)題并具備一系列無(wú)可比擬的優(yōu)勢(shì)。今天小數(shù)就和大家聊一聊容器技術(shù)的優(yōu)勢(shì)和誤...
摘要:嵌套對(duì)象成員會(huì)造成重大性能影響盡量少用。一般來(lái)說(shuō)你可以通過(guò)這種方法提高代碼的性能將經(jīng)常使用的對(duì)象成員數(shù)組項(xiàng)和域外變量存入局部變量中。在反復(fù)訪問(wèn)的地方使用局部變量存放引用小心地處理集合因?yàn)樗麄儽憩F(xiàn)出存在性總是對(duì)底層文檔重新查詢。 前言 本期我來(lái)給大家推薦的書是《高性能JavaScript》,在這本書中我們能夠了解 javascript 開(kāi)發(fā)過(guò)程中的性能瓶頸,如何提升各方面的性能,包括代碼...
摘要:都會(huì)造成錯(cuò)誤,注意一定一定嚴(yán)格的用,所以我建議直接復(fù)制我的。因?yàn)橛玫脑捤麜?huì)轉(zhuǎn)義代碼,寫不寫其實(shí)一個(gè)樣。不可避免的,構(gòu)建肯定是要用到的。這個(gè)時(shí)候一般用的是在外面保存然后里面調(diào)用第二個(gè)坑更隱蔽。 目標(biāo)人群 獻(xiàn)給熟悉基礎(chǔ)的React語(yǔ)法的剛接觸React的同學(xué)~ 如果你已經(jīng)寫過(guò)半年以上的React那也不用看了,畢竟我水平并不高 Whats React React 是一個(gè)不存在的網(wǎng)絡(luò)公司Fac...
摘要:本文章旨在總結(jié)開(kāi)發(fā)過(guò)程中碰到的容易忘記或者比較重要的坑,一方面加深自己對(duì)于該部分的理解,另一方面希望能夠分享給大家,知識(shí)在于分享,當(dāng)然踩過(guò)的坑也不例外滑稽。 在日常工作中,時(shí)常會(huì)碰到各種各樣的坑,有時(shí)真的覺(jué)得很多時(shí)候開(kāi)發(fā)的經(jīng)驗(yàn)都是踩坑踩出來(lái)的。在通往大牛的道路上,希望自己能夠跨越重重阻礙,越走越遠(yuǎn)。學(xué)會(huì)時(shí)??偨Y(jié),不斷提升自己。 本文章旨在總結(jié)開(kāi)發(fā)過(guò)程中碰到的容易忘記或者比較重要的坑,...
閱讀 2947·2023-04-25 18:58
閱讀 1057·2021-11-25 09:43
閱讀 1273·2021-10-25 09:46
閱讀 3567·2021-09-09 11:40
閱讀 1807·2021-08-05 09:59
閱讀 933·2019-08-29 15:07
閱讀 1015·2019-08-29 12:48
閱讀 788·2019-08-29 11:19