摘要:類的屬性和構(gòu)造函數(shù)二的初始化構(gòu)造方法這是的構(gòu)造函數(shù)之一,其他構(gòu)造函數(shù)都引用這個(gè)構(gòu)造函數(shù)進(jìn)行初始化。在構(gòu)造函數(shù)中不會(huì)對(duì)數(shù)組進(jìn)行初始化,只有在等操作方法內(nèi)會(huì)進(jìn)行判斷是否要初始化或擴(kuò)容。其作用是保證的效率。
引言
HashMap在鍵值對(duì)存儲(chǔ)中被經(jīng)常使用,那么它到底是如何實(shí)現(xiàn)鍵值存儲(chǔ)的呢?
一 EntryEntry是Map接口中的一個(gè)內(nèi)部接口,它是實(shí)現(xiàn)鍵值對(duì)存儲(chǔ)關(guān)鍵。在HashMap中,有Entry的實(shí)現(xiàn)類,叫做Entry。Entry類很簡(jiǎn)單,里面包含key,value,由外部引入的hash,還有指向下一個(gè)Entry對(duì)象的引用,和數(shù)據(jù)結(jié)構(gòu)中學(xué)的鏈表中的note節(jié)點(diǎn)很類似。
Entry類的屬性和構(gòu)造函數(shù):
final K key; V value; Entry二 HashMap的初始化next; int hash; /** * Creates new entry. */ Entry(int h, K k, V v, Entry n) { value = v; next = n; key = k; hash = h; }
//HashMap構(gòu)造方法 public HashMap(int initialCapacity, float loadFactor) { if (initialCapacity < 0) throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity); if (initialCapacity > MAXIMUM_CAPACITY) initialCapacity = MAXIMUM_CAPACITY; if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal load factor: " + loadFactor); this.loadFactor = loadFactor; threshold = initialCapacity; init(); }
這是HashMap的構(gòu)造函數(shù)之一,其他構(gòu)造函數(shù)都引用這個(gè)構(gòu)造函數(shù)進(jìn)行初始化。參數(shù)InitialCapacity指的是HashMap中table數(shù)組最初的大小,參數(shù)loadFactory指的是HashMap可容納鍵值對(duì)與數(shù)組長(zhǎng)度的比值(舉個(gè)例子:數(shù)組長(zhǎng)度默認(rèn)值為16,loadFactory默認(rèn)值為0.75,如果HashMap中存儲(chǔ)的鍵值對(duì)即Entry多于12,則會(huì)進(jìn)行擴(kuò)容,擴(kuò)容后大小為當(dāng)前數(shù)組長(zhǎng)度的2倍)。在構(gòu)造函數(shù)中不會(huì)對(duì)數(shù)組進(jìn)行初始化,只有在put等操作方法內(nèi)會(huì)進(jìn)行判斷是否要初始化或擴(kuò)容。
三 table數(shù)組在HashMap中有一個(gè)概念叫做threshold(實(shí)際可容納量),實(shí)際可容納量指的是在HashMap中允許存在最多的Entry的個(gè)數(shù),它是由HashMap中內(nèi)置的數(shù)組table的長(zhǎng)度*load factory(負(fù)載因子)得來(lái)。其作用是保證HashMap的效率。
table數(shù)組是HashMap實(shí)現(xiàn)鍵值對(duì)存儲(chǔ)的又一關(guān)鍵,具體鍵值對(duì)是怎么存的呢?請(qǐng)看下圖
如圖中的[key,value]就是Entry對(duì)象來(lái)實(shí)現(xiàn)的,而table數(shù)組是用來(lái)存放Entry對(duì)象的。
//數(shù)組的初始化: private static int roundUpToPowerOf2(int number) { return number >= MAXIMUM_CAPACITY ? MAXIMUM_CAPACITY : (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1; } private void inflateTable(int toSize) { // Find a power of 2 >= toSize int capacity = roundUpToPowerOf2(toSize); threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1); table = new Entry[capacity]; initHashSeedAsNeeded(capacity); }
在put等方法中發(fā)現(xiàn)數(shù)組未進(jìn)行初始化時(shí)會(huì)調(diào)用InflateTable方法進(jìn)行初始化,輸入?yún)?shù)為初始設(shè)置的InitialCapacity,實(shí)際上他會(huì)調(diào)用roundUpToPowerOf2方法返回一個(gè)比初始容量大的最小的2的冪數(shù)(其中一個(gè)原因是在得到Entry所在數(shù)組位置時(shí)方便)。
四 put方法public V put(K key, V value) { if (table == EMPTY_TABLE) { inflateTable(threshold); } if (key == null) return putForNullKey(value); int hash = hash(key); int i = indexFor(hash, table.length); for (Entrye = table[i]; e != null; e = e.next) { Object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { V oldValue = e.value; e.value = value; e.recordAccess(this); return oldValue; } } modCount++; addEntry(hash, key, value, i); return null; } private V putForNullKey(V value) { for (Entry e = table[0]; e != null; e = e.next) { if (e.key == null) { V oldValue = e.value; e.value = value; e.recordAccess(this); return oldValue; } } modCount++; addEntry(0, null, value, 0); return null; } void addEntry(int hash, K key, V value, int bucketIndex) { if ((size >= threshold) && (null != table[bucketIndex])) { resize(2 * table.length); hash = (null != key) ? hash(key) : 0; bucketIndex = indexFor(hash, table.length); } createEntry(hash, key, value, bucketIndex); } void createEntry(int hash, K key, V value, int bucketIndex) { Entry e = table[bucketIndex]; table[bucketIndex] = new Entry<>(hash, key, value, e); size++; }
在put方法中
首先會(huì)判斷數(shù)組是否為空,如果為空會(huì)對(duì)數(shù)組進(jìn)行初始化。
接下來(lái)判斷key是否為null,如果為null就采用第二個(gè)方法對(duì)鍵值對(duì)進(jìn)行put。
接下來(lái)對(duì)key進(jìn)行hash得到一個(gè)數(shù)值,再對(duì)這個(gè)數(shù)值進(jìn)行處理(IndexFor方法)得到所在數(shù)組中的位置。
接下來(lái)會(huì)遍歷所在數(shù)組位置的鏈表,如果key的hash和傳入key的hash相同且(key內(nèi)存地址相等 或 equals方法相等),則意味著會(huì)更新在鏈表中的value值,并返回舊的value值。
如果上邊的方法都沒有奏效,則會(huì)調(diào)用第三個(gè)方法,創(chuàng)建一個(gè)新的Entry對(duì)象。
在putForNullKey方法中,我們看到它是為了NULL值專門設(shè)置的,NULL值的hash始終為0,所以key為NULL的Entry對(duì)象肯定在數(shù)組的第0個(gè)位置。同樣,如果找到則更新,沒有找到則添加。
調(diào)用addEntry方法意味著要往這個(gè)數(shù)組鏈表中添加一個(gè)Entry,所以會(huì)在最開始判斷已經(jīng)存在的Entry數(shù)量是否超過了實(shí)際可容納量。如果超過了,則會(huì)調(diào)用resize方法將數(shù)組擴(kuò)大兩倍,注意在擴(kuò)大之后會(huì)對(duì)已經(jīng)存入的Entry進(jìn)行重排,原因是當(dāng)初存入時(shí)IndexFor方法與數(shù)組長(zhǎng)度有關(guān)系。接著會(huì)調(diào)用第四個(gè)方法。
createEntry方法很簡(jiǎn)單,就是將原本在數(shù)組中存放的鏈表頭置入到新的Entry之后,將新的Entry放入數(shù)組中。從這里我們可以看出HashMap不保證順序問題。
get方法和contains方法原理和put方法一致,即先通過對(duì)key的hash得到其value值所在的鏈表頭在數(shù)組中的位置,再通過equals方法判斷value是否存在。
五 其他//hash方法 final int hash(Object k) { int h = hashSeed; if (0 != h && k instanceof String) { return sun.misc.Hashing.stringHash32((String) k); } h ^= k.hashCode(); // This function ensures that hashCodes that differ only by // constant multiples at each bit position have a bounded // number of collisions (approximately 8 at default load factor). h ^= (h >>> 20) ^ (h >>> 12); return h ^ (h >>> 7) ^ (h >>> 4); }
hash方法中最終返回值與key的hashCode方法有關(guān)。
總結(jié)最終數(shù)組初始化的容量大小會(huì)是大于等于你傳入初始容量的最小2的冪數(shù)。
key為null或value為null能存入HashMap的原因是對(duì)null值會(huì)進(jìn)行多帶帶的操作。
在table數(shù)組中的鏈表中每個(gè)Entry的共同點(diǎn)是key的hash(key.hashCode)部分相同。
注意對(duì)key的hashCode和equals方法的重寫當(dāng)你想讓兩個(gè)key映射一個(gè)對(duì)象,因?yàn)榕卸╧ey相等的條件是(hashCode相等+(內(nèi)存相等 或 equals相等))。
最早存入的鍵值對(duì)會(huì)在鏈表的末端。
當(dāng)數(shù)組沒有鏈表存在時(shí),HashMap性能最好為O(1)。而最差為O(threshould)。
更多文章:http://blog.gavinzh.com
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/64417.html
摘要:注意這里我說(shuō)的是一般情況下,因?yàn)楣K惴ㄐ枰骖櫺阅芘c準(zhǔn)確性,是有一定概率出現(xiàn)重復(fù)的情況的。哈希算法實(shí)際上是數(shù)學(xué)家和計(jì)算機(jī)基礎(chǔ)科學(xué)家研究的領(lǐng)域。 背景 做了幾年 CRUD 工程師,深感自己的計(jì)算機(jī)基礎(chǔ)薄弱,在看了幾篇大牛的分享文章之后,發(fā)現(xiàn)很多人都是通過刷 LeetCode 來(lái)提高自己的算法水平。的確,通過分析解決實(shí)際的問題,比自己潛心研究書本效率還是要高一些。 一直以來(lái)遇到底層自己無(wú)...
摘要:本文是作者自己對(duì)中線程的狀態(tài)線程間協(xié)作相關(guān)使用的理解與總結(jié),不對(duì)之處,望指出,共勉。當(dāng)中的的數(shù)目而不是已占用的位置數(shù)大于集合番一文通版集合番一文通版垃圾回收機(jī)制講得很透徹,深入淺出。 一小時(shí)搞明白自定義注解 Annotation(注解)就是 Java 提供了一種元程序中的元素關(guān)聯(lián)任何信息和著任何元數(shù)據(jù)(metadata)的途徑和方法。Annotion(注解) 是一個(gè)接口,程序可以通過...
摘要:前言本文的目的是閱讀理解的源碼,作為集合中重要的一個(gè)角色,平時(shí)用到十分多的一個(gè)類,深入理解它,知其所以然很重要。 前言 本文的目的是閱讀理解HashMap的源碼,作為集合中重要的一個(gè)角色,平時(shí)用到十分多的一個(gè)類,深入理解它,知其所以然很重要。本文基于Jdk1.7,因?yàn)镴dk1.8改變了HashMap的數(shù)據(jù)結(jié)構(gòu),進(jìn)行了優(yōu)化,我們先從基礎(chǔ)閱讀,之后再閱讀理解Jdk1.8的內(nèi)容 HashMa...
摘要:為了避免一篇文章的篇幅過長(zhǎng),于是一些比較大的主題就都分成幾篇來(lái)講了,這篇文章是筆者所有文章的目錄,將會(huì)持續(xù)更新,以給大家一個(gè)查看系列文章的入口。 前言 大家好,筆者是今年才開始寫博客的,寫作的初衷主要是想記錄和分享自己的學(xué)習(xí)經(jīng)歷。因?yàn)閷懽鞯臅r(shí)候發(fā)現(xiàn),為了弄懂一個(gè)知識(shí),不得不先去了解另外一些知識(shí),這樣以來(lái),為了說(shuō)明一個(gè)問題,就要把一系列知識(shí)都了解一遍,寫出來(lái)的文章就特別長(zhǎng)。 為了避免一篇...
摘要:為了避免一篇文章的篇幅過長(zhǎng),于是一些比較大的主題就都分成幾篇來(lái)講了,這篇文章是筆者所有文章的目錄,將會(huì)持續(xù)更新,以給大家一個(gè)查看系列文章的入口。 前言 大家好,筆者是今年才開始寫博客的,寫作的初衷主要是想記錄和分享自己的學(xué)習(xí)經(jīng)歷。因?yàn)閷懽鞯臅r(shí)候發(fā)現(xiàn),為了弄懂一個(gè)知識(shí),不得不先去了解另外一些知識(shí),這樣以來(lái),為了說(shuō)明一個(gè)問題,就要把一系列知識(shí)都了解一遍,寫出來(lái)的文章就特別長(zhǎng)。 為了避免一篇...
閱讀 1361·2023-04-25 23:22
閱讀 1756·2023-04-25 20:04
閱讀 2695·2021-11-22 15:24
閱讀 2879·2021-11-11 16:54
閱讀 1945·2019-08-30 14:03
閱讀 1544·2019-08-29 16:35
閱讀 1759·2019-08-26 10:29
閱讀 2811·2019-08-23 18:01