摘要:編譯器,和處理器會共同確保單線程程序的執(zhí)行結果與該程序在順序一致性模型中的執(zhí)行結果相同。正確同步的多線程程序的執(zhí)行將具有順序一致性程序的執(zhí)行結果與該程序在順序一致性內存模型中的執(zhí)行結果相同。
前情提要 深入理解Java內存模型(六)——final
處理器內存模型順序一致性內存模型是一個理論參考模型,JMM和處理器內存模型在設計時通常會把順序一致性內存模型作為參照。JMM和處理器內存模型在設計時會對順序一致性模型做一些放松,因為如果完全按照順序一致性模型來實現處理器和JMM,那么很多的處理器和編譯器優(yōu)化都要被禁止,這對執(zhí)行性能將會有很大的影響。
根據對不同類型讀/寫操作組合的執(zhí)行順序的放松,可以把常見處理器的內存模型劃分為下面幾種類型:
放松程序中寫-讀操作的順序,由此產生了total store ordering內存模型(簡稱為TSO)。
在前面1的基礎上,繼續(xù)放松程序中寫-寫操作的順序,由此產生了partial store order 內存模型(簡稱為PSO)。
在前面1和2的基礎上,繼續(xù)放松程序中讀-寫和讀-讀操作的順序,由此產生了relaxed memory order內存模型(簡稱為RMO)和PowerPC內存模型。
注意,這里處理器對讀/寫操作的放松,是以兩個操作之間不存在數據依賴性為前提的(因為處理器要遵守as-if-serial語義,處理器不會對存在數據依賴性的兩個內存操作做重排序)。
下面的表格展示了常見處理器內存模型的細節(jié)特征:
-------------- -------------- ------------------- ------------------- ------------------------------ ------------------------------ ------------------------------ 內存模型名稱 對應的處理器 Store-Load 重排序 Store-Store重排序 Load-Load 和Load-Store重排序 可以更早讀取到其它處理器的寫 可以更早讀取到當前處理器的寫 TSO sparc-TSOX64 Y Y PSO sparc-PSO Y Y Y RMO ia64 Y Y Y Y PowerPC PowerPC Y Y Y Y Y -------------- -------------- ------------------- ------------------- ------------------------------ ------------------------------ ------------------------------
在這個表格中,我們可以看到所有處理器內存模型都允許寫-讀重排序,原因在第一章以說明過:它們都使用了寫緩存區(qū),寫緩存區(qū)可能導致寫-讀操作重排序。同時,我們可以看到這些處理器內存模型都允許更早讀到當前處理器的寫,原因同樣是因為寫緩存區(qū):由于寫緩存區(qū)僅對當前處理器可見,這個特性導致當前處理器可以比其他處理器先看到臨時保存在自己的寫緩存區(qū)中的寫。
上面表格中的各種處理器內存模型,從上到下,模型由強變弱。越是追求性能的處理器,內存模型設計的會越弱。因為這些處理器希望內存模型對它們的束縛越少越好,這樣它們就可以做盡可能多的優(yōu)化來提高性能。
由于常見的處理器內存模型比JMM要弱,java編譯器在生成字節(jié)碼時,會在執(zhí)行指令序列的適當位置插入內存屏障來限制處理器的重排序。同時,由于各種處理器內存模型的強弱并不相同,為了在不同的處理器平臺向程序員展示一個一致的內存模型,JMM在不同的處理器中需要插入的內存屏障的數量和種類也不相同。下圖展示了JMM在不同處理器內存模型中需要插入的內存屏障的示意圖:
如上圖所示,JMM屏蔽了不同處理器內存模型的差異,它在不同的處理器平臺之上為java程序員呈現了一個一致的內存模型。
JMM,處理器內存模型與順序一致性內存模型之間的關系JMM是一個語言級的內存模型,處理器內存模型是硬件級的內存模型,順序一致性內存模型是一個理論參考模型。下面是語言內存模型,處理器內存模型和順序一致性內存模型的強弱對比示意圖:
從上圖我們可以看出:常見的4種處理器內存模型比常用的3中語言內存模型要弱,處理器內存模型和語言內存模型都比順序一致性內存模型要弱。同處理器內存模型一樣,越是追求執(zhí)行性能的語言,內存模型設計的會越弱。
JMM的設計從JMM設計者的角度來說,在設計JMM時,需要考慮兩個關鍵因素:
程序員對內存模型的使用。程序員希望內存模型易于理解,易于編程。程序員希望基于一個強內存模型來編寫代碼。
編譯器和處理器對內存模型的實現。編譯器和處理器希望內存模型對它們的束縛越少越好,這樣它們就可以做盡可能多的優(yōu)化來提高性能。編譯器和處理器希望實現一個弱內存模型。
由于這兩個因素互相矛盾,所以JSR-133專家組在設計JMM時的核心目標就是找到一個好的平衡點:一方面要為程序員提供足夠強的內存可見性保證;另一方面,對編譯器和處理器的限制要盡可能的放松。下面讓我們看看JSR-133是如何實現這一目標的。
為了具體說明,請看前面提到過的計算圓面積的示例代碼:
double pi = 3.14; //A double r = 1.0; //B double area = pi * r * r; //C
上面計算圓的面積的示例代碼存在三個happens- before關系:
A happens- before B;
B happens- before C;
A happens- before C;
由于A happens- before B,happens- before的定義會要求:A操作執(zhí)行的結果要對B可見,且A操作的執(zhí)行順序排在B操作之前。 但是從程序語義的角度來說,對A和B做重排序既不會改變程序的執(zhí)行結果,也還能提高程序的執(zhí)行性能(允許這種重排序減少了對編譯器和處理器優(yōu)化的束縛)。也就是說,上面這3個happens- before關系中,雖然2和3是必需要的,但1是不必要的。因此,JMM把happens- before要求禁止的重排序分為了下面兩類:
會改變程序執(zhí)行結果的重排序。
不會改變程序執(zhí)行結果的重排序。
JMM對這兩種不同性質的重排序,采取了不同的策略:
對于會改變程序執(zhí)行結果的重排序,JMM要求編譯器和處理器必須禁止這種重排序。
對于不會改變程序執(zhí)行結果的重排序,JMM對編譯器和處理器不作要求(JMM允許這種重排序)。
下面是JMM的設計示意圖:
從上圖可以看出兩點:
JMM向程序員提供的happens- before規(guī)則能滿足程序員的需求。JMM的happens- before規(guī)則不但簡單易懂,而且也向程序員提供了足夠強的內存可見性保證(有些內存可見性保證其實并不一定真實存在,比如上面的A happens- before B)。
JMM對編譯器和處理器的束縛已經盡可能的少。從上面的分析我們可以看出,JMM其實是在遵循一個基本原則:只要不改變程序的執(zhí)行結果(指的是單線程程序和正確同步的多線程程序),編譯器和處理器怎么優(yōu)化都行。比如,如果編譯器經過細致的分析后,認定一個鎖只會被單個線程訪問,那么這個鎖可以被消除。再比如,如果編譯器經過細致的分析后,認定一個volatile變量僅僅只會被單個線程訪問,那么編譯器可以把這個volatile變量當作一個普通變量來對待。這些優(yōu)化既不會改變程序的執(zhí)行結果,又能提高程序的執(zhí)行效率。
JMM的內存可見性保證Java程序的內存可見性保證按程序類型可以分為下列三類:
單線程程序。單線程程序不會出現內存可見性問題。編譯器,runtime和處理器會共同確保單線程程序的執(zhí)行結果與該程序在順序一致性模型中的執(zhí)行結果相同。
正確同步的多線程程序。正確同步的多線程程序的執(zhí)行將具有順序一致性(程序的執(zhí)行結果與該程序在順序一致性內存模型中的執(zhí)行結果相同)。這是JMM關注的重點,JMM通過限制編譯器和處理器的重排序來為程序員提供內存可見性保證。
未同步/未正確同步的多線程程序。JMM為它們提供了最小安全性保障:線程執(zhí)行時讀取到的值,要么是之前某個線程寫入的值,要么是默認值(0,null,false)。
下圖展示了這三類程序在JMM中與在順序一致性內存模型中的執(zhí)行結果的異同:
只要多線程程序是正確同步的,JMM保證該程序在任意的處理器平臺上的執(zhí)行結果,與該程序在順序一致性內存模型中的執(zhí)行結果一致。
JSR-133對舊內存模型的修補JSR-133對JDK5之前的舊內存模型的修補主要有兩個:
增強volatile的內存語義。舊內存模型允許volatile變量與普通變量重排序。JSR-133嚴格限制volatile變量與普通變量的重排序,使volatile的寫-讀和鎖的釋放-獲取具有相同的內存語義。
增強final的內存語義。在舊內存模型中,多次讀取同一個final變量的值可能會不相同。為此,JSR-133為final增加了兩個重排序規(guī)則?,F在,final具有了初始化安全性。
參考文獻Computer Architecture: A Quantitative Approach, 4th Edition
Shared memory consistency models: A tutorial
Intel? Itanium? Architecture Software Developer’s Manual Volume 2: System Architecture
Concurrent Programming on Windows
JSR 133 (Java Memory Model) FAQ
The JSR-133 Cookbook for Compiler Writers
Java theory and practice: Fixing the Java Memory Model, Part 2
關于作者程曉明,Java軟件工程師,國家認證的系統分析師、信息項目管理師。專注于并發(fā)編程,個人郵箱:asst2003@163.com。
via ifeve
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規(guī)行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://www.ezyhdfw.cn/yun/64091.html
摘要:我的是忙碌的一年,從年初備戰(zhàn)實習春招,年三十都在死磕源碼,三月份經歷了阿里五次面試,四月順利收到實習。因為我心理很清楚,我的目標是阿里。所以在收到阿里之后的那晚,我重新規(guī)劃了接下來的學習計劃,將我的短期目標更新成拿下阿里轉正。 我的2017是忙碌的一年,從年初備戰(zhàn)實習春招,年三十都在死磕JDK源碼,三月份經歷了阿里五次面試,四月順利收到實習offer。然后五月懷著忐忑的心情開始了螞蟻金...
摘要:對于域,編譯器和處理器要遵守兩個重排序規(guī)則在構造函數內對一個域的寫入,與隨后把這個被構造對象的引用賦值給一個引用變量,這兩個操作之間不能重排序。這個屏障禁止處理器把域的寫重排序到構造函數之外。下一篇深入理解內存模型七總結 與前面介紹的鎖和volatile相比較,對final域的讀和寫更像是普通的變量訪問。對于final域,編譯器和處理器要遵守兩個重排序規(guī)則: 在構造函數內對一個fi...
摘要:導讀閱讀本文需要有足夠的時間,筆者會由淺到深帶你一步一步了解一個資深架構師所要掌握的各類知識點,你也可以按照文章中所列的知識體系對比自身,對自己進行查漏補缺,覺得本文對你有幫助的話,可以點贊關注一下。目錄一基礎篇二進階篇三高級篇四架構篇五擴 導讀:閱讀本文需要有足夠的時間,筆者會由淺到深帶你一步一步了解一個資深架構師所要掌握的各類知識點,你也可以按照文章中所列的知識體系對比自身,對自己...
摘要:掌握的內存模型,你就是解決并發(fā)問題最靚的仔編譯優(yōu)化說的具體一些,這些方法包括和關鍵字,以及內存模型中的規(guī)則。掌握的內存模型,你就是解決并發(fā)問題最靚的仔共享變量藍色的虛線箭頭代表禁用了緩存,黑色的實線箭頭代表直接從主內存中讀寫數據。 摘要:如果編寫的并發(fā)程序出現問題時,很難通過調試來解決相應的問題,此時,需要一行行的檢查代碼...
摘要:上一篇文章講解了虛擬機中的內存布局,這里就稍作拓展,聊聊對象在虛擬機中的一些存儲細節(jié)吧。參考文檔深入理解虛擬機高級特效與最佳實現,第章周志明著系列筆記內存區(qū)域和機制明舞深入理解結構團長聯系作者 上一篇文章講解了 java 虛擬機中的內存布局,這里就稍作拓展,聊聊 java 對象在虛擬機中的一些存儲細節(jié)吧。 本文主要圍繞虛擬機中對象如何創(chuàng)建?對象內存都放些什么?如何訪問對象內存?這么三...
閱讀 3374·2021-11-24 09:39
閱讀 3948·2021-11-22 09:34
閱讀 5012·2021-08-11 11:17
閱讀 1159·2019-08-29 13:58
閱讀 2656·2019-08-28 18:18
閱讀 616·2019-08-26 12:24
閱讀 906·2019-08-26 12:14
閱讀 828·2019-08-26 11:58