508 技術社區[雲棲]

深入分析synchronized的實現原理

記得剛剛開始學習Java的時候，一遇到多線程情況就是synchronized，相對於當時的我們來說synchronized是這麼的神奇而又強大，那個時候我們賦予它一個名字“同步”，也成為了我們解決多線程情況的百試不爽的良藥。但是，隨著我們學習的進行我們知道synchronized是一個重量級鎖，相對於Lock，它會顯得那麼笨重，以至於我們認為它不是那麼的高效而慢慢摒棄它。
誠然，隨著Javs SE 1.6對synchronized進行的各種優化後，synchronized並不會顯得那麼重了。下麵跟隨LZ一起來探索synchronized的實現機製、Java是如何對它進行了優化、鎖優化機製、鎖的存儲結構和升級過程；

Java中每一個對象都可以作為鎖，這是synchronized實現同步的基礎：

普通同步方法，鎖是當前實例對象
靜態同步方法，鎖是當前類的class對象
同步方法塊，鎖是括號裏麵的對象
當一個線程訪問同步代碼塊時，它首先是需要得到鎖才能執行同步代碼，當退出或者拋出異常時必須要釋放鎖，那麼它是如何來實現這個機製的呢？我們先看一段簡單的代碼：

public class SynchronizedTest {
    public synchronized void test1(){

    }

    public void test2(){
        synchronized (this){

        }
    }
}

利用javap工具查看生成的class文件信息來分析Synchronize的實現



從上麵可以看出，同步代碼塊是使用monitorenter和monitorexit指令實現的，同步方法（在這看不出來需要看JVM底層實現）依靠的是方法修飾符上的ACC_SYNCHRONIZED實現。
同步代碼塊：monitorenter指令插入到同步代碼塊的開始位置，monitorexit指令插入到同步代碼塊的結束位置，JVM需要保證每一個monitorenter都有一個monitorexit與之相對應。任何對象都有一個monitor與之相關聯，當且一個monitor被持有之後，他將處於鎖定狀態。線程執行到monitorenter指令時，將會嚐試獲取對象所對應的monitor所有權，即嚐試獲取對象的鎖；
同步方法：synchronized方法則會被翻譯成普通的方法調用和返回指令如:invokevirtual、areturn指令，在VM字節碼層麵並沒有任何特別的指令來實現被synchronized修飾的方法，而是在Class文件的方法表中將該方法的access_flags字段中的synchronized標誌位置1，表示該方法是同步方法並使用調用該方法的對象或該方法所屬的Class在JVM的內部對象表示Klass做為鎖對象。(摘自：https://www.cnblogs.com/javaminer/p/3889023.html)

下麵我們來繼續分析，但是在深入之前我們需要了解兩個重要的概念：Java對象頭，Monitor。

Java對象頭和monitor是實現synchronized的基礎！下麵就這兩個概念來做詳細介紹。

synchronized用的鎖是存在Java對象頭裏的，那麼什麼是Java對象頭呢？Hotspot虛擬機的對象頭主要包括兩部分數據：Mark Word（標記字段）、Klass Pointer（類型指針）。其中Klass Point是是對象指向它的類元數據的指針，虛擬機通過這個指針來確定這個對象是哪個類的實例，Mark Word用於存儲對象自身的運行時數據，它是實現輕量級鎖和偏向鎖的關鍵，所以下麵將重點闡述

Mark Word。
Mark Word用於存儲對象自身的運行時數據，如哈希碼（HashCode）、GC分代年齡、鎖狀態標誌、線程持有的鎖、偏向線程 ID、偏向時間戳等等。Java對象頭一般占有兩個機器碼（在32位虛擬機中，1個機器碼等於4字節，也就是32bit），但是如果對象是數組類型，則需要三個機器碼，因為JVM虛擬機可以通過Java對象的元數據信息確定Java對象的大小，但是無法從數組的元數據來確認數組的大小，所以用一塊來記錄數組長度。下圖是Java對象頭的存儲結構（32位虛擬機）：

對象頭信息是與對象自身定義的數據無關的額外存儲成本，但是考慮到虛擬機的空間效率，Mark Word被設計成一個非固定的數據結構以便在極小的空間內存存儲盡量多的數據，它會根據對象的狀態複用自己的存儲空間，也就是說，Mark Word會隨著程序的運行發生變化，變化狀態如下（32位虛擬機）：

簡單介紹了Java對象頭，我們下麵再看Monitor。

什麼是Monitor？我們可以把它理解為一個同步工具，也可以描述為一種同步機製，它通常被描述為一個對象。
與一切皆對象一樣，所有的Java對象是天生的Monitor，每一個Java對象都有成為Monitor的潛質，因為在Java的設計中，每一個Java對象自打娘胎裏出來就帶了一把看不見的鎖，它叫做內部鎖或者Monitor鎖。
Monitor 是線程私有的數據結構，每一個線程都有一個可用monitor record列表，同時還有一個全局的可用列表。每一個被鎖住的對象都會和一個monitor關聯（對象頭的MarkWord中的LockWord指向monitor的起始地址），同時monitor中有一個Owner字段存放擁有該鎖的線程的唯一標識，表示該鎖被這個線程占用。其結構如下：

Owner：初始時為NULL表示當前沒有任何線程擁有該monitor record，當線程成功擁有該鎖後保存線程唯一標識，當鎖被釋放時又設置為NULL；
EntryQ:關聯一個係統互斥鎖（semaphore），阻塞所有試圖鎖住monitor record失敗的線程。
RcThis:表示blocked或waiting在該monitor record上的所有線程的個數。
Nest:用來實現重入鎖的計數。
HashCode:保存從對象頭拷貝過來的HashCode值（可能還包含GC age）。
Candidate:用來避免不必要的阻塞或等待線程喚醒，因為每一次隻有一個線程能夠成功擁有鎖，如果每次前一個釋放鎖的線程喚醒所有正在阻塞或等待的線程，會引起不必要的上下文切換（從阻塞到就緒然後因為競爭鎖失敗又被阻塞）從而導致性能嚴重下降。Candidate隻有兩種可能的值0表示沒有需要喚醒的線程1表示要喚醒一個繼任線程來競爭鎖。
摘自：Java中synchronized的實現原理與應用）
我們知道synchronized是重量級鎖，效率不怎麼滴，同時這個觀念也一直存在我們腦海裏，不過在jdk 1.6中對synchronize的實現進行了各種優化，使得它顯得不是那麼重了，那麼JVM采用了那些優化手段呢？

jdk1.6對鎖的實現引入了大量的優化，如自旋鎖、適應性自旋鎖、鎖消除、鎖粗化、偏向鎖、輕量級鎖等技術來減少鎖操作的開銷。
鎖主要存在四中狀態，依次是：無鎖狀態、偏向鎖狀態、輕量級鎖狀態、重量級鎖狀態，他們會隨著競爭的激烈而逐漸升級。注意鎖可以升級不可降級，這種策略是為了提高獲得鎖和釋放鎖的效率。

線程的阻塞和喚醒需要CPU從用戶態轉為核心態，頻繁的阻塞和喚醒對CPU來說是一件負擔很重的工作，勢必會給係統的並發性能帶來很大的壓力。同時我們發現在許多應用上麵，對象鎖的鎖狀態隻會持續很短一段時間，為了這一段很短的時間頻繁地阻塞和喚醒線程是非常不值得的。所以引入自旋鎖。
何謂自旋鎖？
所謂自旋鎖，就是讓該線程等待一段時間，不會被立即掛起，看持有鎖的線程是否會很快釋放鎖。怎麼等待呢？執行一段無意義的循環即可（自旋）。
自旋等待不能替代阻塞，先不說對處理器數量的要求（多核，貌似現在沒有單核的處理器了），雖然它可以避免線程切換帶來的開銷，但是它占用了處理器的時間。如果持有鎖的線程很快就釋放了鎖，那麼自旋的效率就非常好，反之，自旋的線程就會白白消耗掉處理的資源，它不會做任何有意義的工作，典型的占著茅坑不拉屎，這樣反而會帶來性能上的浪費。所以說，自旋等待的時間（自旋的次數）必須要有一個限度，如果自旋超過了定義的時間仍然沒有獲取到鎖，則應該被掛起。
自旋鎖在JDK 1.4.2中引入，默認關閉，但是可以使用-XX:+UseSpinning開開啟，在JDK1.6中默認開啟。同時自旋的默認次數為10次，可以通過參數-XX:PreBlockSpin來調整；
如果通過參數-XX:preBlockSpin來調整自旋鎖的自旋次數，會帶來諸多不便。假如我將參數調整為10，但是係統很多線程都是等你剛剛退出的時候就釋放了鎖（假如你多自旋一兩次就可以獲取鎖），你是不是很尷尬。於是JDK1.6引入自適應的自旋鎖，讓虛擬機會變得越來越聰明。

JDK 1.6引入了更加聰明的自旋鎖，即自適應自旋鎖。所謂自適應就意味著自旋的次數不再是固定的，它是由前一次在同一個鎖上的自旋時間及鎖的擁有者的狀態來決定。它怎麼做呢？線程如果自旋成功了，那麼下次自旋的次數會更加多，因為虛擬機認為既然上次成功了，那麼此次自旋也很有可能會再次成功，那麼它就會允許自旋等待持續的次數更多。反之，如果對於某個鎖，很少有自旋能夠成功的，那麼在以後要或者這個鎖的時候自旋的次數會減少甚至省略掉自旋過程，以免浪費處理器資源。
有了自適應自旋鎖，隨著程序運行和性能監控信息的不斷完善，虛擬機對程序鎖的狀況預測會越來越準確，虛擬機會變得越來越聰明。

為了保證數據的完整性，我們在進行操作時需要對這部分操作進行同步控製，但是在有些情況下，JVM檢測到不可能存在共享數據競爭，這是JVM會對這些同步鎖進行鎖消除。鎖消除的依據是逃逸分析的數據支持。
如果不存在競爭，為什麼還需要加鎖呢？所以鎖消除可以節省毫無意義的請求鎖的時間。變量是否逃逸，對於虛擬機來說需要使用數據流分析來確定，但是對於我們程序員來說這還不清楚麼？我們會在明明知道不存在數據競爭的代碼塊前加上同步嗎？但是有時候程序並不是我們所想的那樣？我們雖然沒有顯示使用鎖，但是我們在使用一些JDK的內置API時，如StringBuffer、Vector、HashTable等，這個時候會存在隱形的加鎖操作。比如StringBuffer的append()方法，Vector的add()方法：

   public void vectorTest(){
        Vector<String> vector = new Vector<String>();
        for(int i = 0 ; i < 10 ; i++){
            vector.add(i + "");
        }

        System.out.println(vector);
    }

在運行這段代碼時，JVM可以明顯檢測到變量vector沒有逃逸出方法vectorTest()之外，所以JVM可以大膽地將vector內部的加鎖操作消除。

我們知道在使用同步鎖的時候，需要讓同步塊的作用範圍盡可能小—僅在共享數據的實際作用域中才進行同步，這樣做的目的是為了使需要同步的操作數量盡可能縮小，如果存在鎖競爭，那麼等待鎖的線程也能盡快拿到鎖。
在大多數的情況下，上述觀點是正確的，LZ也一直堅持著這個觀點。但是如果一係列的連續加鎖解鎖操作，可能會導致不必要的性能損耗，所以引入鎖粗話的概念。
鎖粗話概念比較好理解，就是將多個連續的加鎖、解鎖操作連接在一起，擴展成一個範圍更大的鎖。如上麵實例：vector每次add的時候都需要加鎖操作，JVM檢測到對同一個對象（vector）連續加鎖、解鎖操作，會合並一個更大範圍的加鎖、解鎖操作，即加鎖解鎖操作會移到for循環之外。

引入輕量級鎖的主要目的是在多沒有多線程競爭的前提下，減少傳統的重量級鎖使用操作係統互斥量產生的性能消耗。當關閉偏向鎖功能或者多個線程競爭偏向鎖導致偏向鎖升級為輕量級鎖，則會嚐試獲取輕量級鎖，其步驟如下：

獲取鎖

判斷當前對象是否處於無鎖狀態（hashcode、0、01），若是，則JVM首先將在當前線程的棧幀中建立一個名為鎖記錄（Lock Record）的空間，用於存儲鎖對象目前的Mark Word的拷貝（官方把這份拷貝加了一個Displaced前綴，即Displaced Mark Word）；否則執行步驟（3）；
JVM利用CAS操作嚐試將對象的Mark Word更新為指向Lock Record的指正，如果成功表示競爭到鎖，則將鎖標誌位變成00（表示此對象處於輕量級鎖狀態），執行同步操作；如果失敗則執行步驟（3）；
判斷當前對象的Mark Word是否指向當前線程的棧幀，如果是則表示當前線程已經持有當前對象的鎖，則直接執行同步代碼塊；否則隻能說明該鎖對象已經被其他線程搶占了，這時輕量級鎖需要膨脹為重量級鎖，鎖標誌位變成10，後麵等待的線程將會進入阻塞狀態；

**釋放鎖 **

輕量級鎖的釋放也是通過CAS操作來進行的，主要步驟如下：

取出在獲取輕量級鎖保存在Displaced Mark Word中的數據；
用CAS操作將取出的數據替換當前對象的Mark Word中，如果成功，則說明釋放鎖成功，否則執行（3）；
如果CAS操作替換失敗，說明有其他線程嚐試獲取該鎖，則需要在釋放鎖的同時需要喚醒被掛起的線程。
對於輕量級鎖，其性能提升的依據是“對於絕大部分的鎖，在整個生命周期內都是不會存在競爭的”，如果打破這個依據則除了互斥的開銷外，還有額外的CAS操作，因此在有多線程競爭的情況下，輕量級鎖比重量級鎖更慢；

下圖是輕量級鎖的獲取和釋放過程

引入偏向鎖主要目的是：為了在無多線程競爭的情況下盡量減少不必要的輕量級鎖執行路徑。上麵提到了輕量級鎖的加鎖解鎖操作是需要依賴多次CAS原子指令的。那麼偏向鎖是如何來減少不必要的CAS操作呢？我們可以查看Mark work的結構就明白了。隻需要檢查是否為偏向鎖、鎖標識為以及ThreadID即可，處理流程如下：
獲取鎖

檢測Mark Word是否為可偏向狀態，即是否為偏向鎖1，鎖標識位為01；
若為可偏向狀態，則測試線程ID是否為當前線程ID，如果是，則執行步驟（5），否則執行步驟（3）；
如果線程ID不為當前線程ID，則通過CAS操作競爭鎖，競爭成功，則將Mark Word的線程ID替換為當前線程ID，否則執行線程（4）；
通過CAS競爭鎖失敗，證明當前存在多線程競爭情況，當到達全局安全點，獲得偏向鎖的線程被掛起，偏向鎖升級為輕量級鎖，然後被阻塞在安全點的線程繼續往下執行同步代碼塊；
執行同步代碼塊
釋放鎖
偏向鎖的釋放采用了一種隻有競爭才會釋放鎖的機製，線程是不會主動去釋放偏向鎖，需要等待其他線程來競爭。偏向鎖的撤銷需要等待全局安全點（這個時間點是上沒有正在執行的代碼）。其步驟如下：

暫停擁有偏向鎖的線程，判斷鎖對象石是否還處於被鎖定狀態；
撤銷偏向蘇，恢複到無鎖狀態（01）或者輕量級鎖的狀態；
下圖是偏向鎖的獲取和釋放流程

重量級鎖通過對象內部的監視器（monitor）實現，其中monitor的本質是依賴於底層操作係統的Mutex Lock實現，操作係統實現線程之間的切換需要從用戶態到內核態的切換，切換成本非常高。

原文鏈接

最後更新：2017-07-13 13:32:34

深入分析synchronized的實現原理

上一篇： Access入庫檢驗係統功能分析（本件確認、本批確認）

下一篇： TensorFlow在iOS和Mac上的使用

相關內容

熱門內容

最新內容