閱讀886 返回首頁    go 阿裏雲 go 技術社區[雲棲]


《Java並發編程的藝術》-Java並發包中的讀寫鎖及其實現分析

1. 前言

在Java並發包中常用的鎖(如:ReentrantLock),基本上都是排他鎖,這些鎖在同一時刻隻允許一個線程進行訪問,而讀寫鎖在同一時刻可以允許多個讀線程訪問,但是在寫線程訪問時,所有的讀線程和其他寫線程均被阻塞。讀寫鎖維護了一對鎖,一個讀鎖和一個寫鎖,通過分離讀鎖和寫鎖,使得並發性相比一般的排他鎖有了很大提升。

除了保證寫操作對讀操作的可見性以及並發性的提升之外,讀寫鎖能夠簡化讀寫交互場景的編程方式。假設在程序中定義一個共享的數據結構用作緩存,它大部分時間提供讀服務(例如:查詢和搜索),而寫操作占有的時間很少,但是寫操作完成之後的更新需要對後續的讀服務可見。

在沒有讀寫鎖支持的(Java 5 之前)時候,如果需要完成上述工作就要使用Java的等待通知機製,就是當寫操作開始時,所有晚於寫操作的讀操作均會進入等待狀態,隻有寫操作完成並進行通知之後,所有等待的讀操作才能繼續執行(寫操作之間依靠synchronized關鍵字進行同步),這樣做的目的是使讀操作都能讀取到正確的數據,而不會出現髒讀。改用讀寫鎖實現上述功能,隻需要在讀操作時獲取讀鎖,而寫操作時獲取寫鎖即可,當寫鎖被獲取到時,後續(非當前寫操作線程)的讀寫操作都會被阻塞,寫鎖釋放之後,所有操作繼續執行,編程方式相對於使用等待通知機製的實現方式而言,變得簡單明了。

一般情況下,讀寫鎖的性能都會比排它鎖要好,因為大多數場景讀是多於寫的。在讀多於寫的情況下,讀寫鎖能夠提供比排它鎖更好的並發性和吞吐量。Java並發包提供讀寫鎖的實現是ReentrantReadWriteLock,它提供的特性如表1所示。

表1. ReentrantReadWriteLock的特性

特性 說明
公平性選擇 支持非公平(默認)和公平的鎖獲取方式,吞吐量還是非公平優於公平
重進入 該鎖支持重進入,以讀寫線程為例:讀線程在獲取了讀鎖之後,能夠再次獲取讀鎖。而寫線程在獲取了寫鎖之後能夠再次獲取寫鎖,同時也可以獲取讀鎖
鎖降級 遵循獲取寫鎖、獲取讀鎖再釋放寫鎖的次序,寫鎖能夠降級成為讀鎖

2. 讀寫鎖的接口與示例

ReadWriteLock僅定義了獲取讀鎖和寫鎖的兩個方法,即readLock()和writeLock()方法,而其實現—ReentrantReadWriteLock,除了接口方法之外,還提供了一些便於外界監控其內部工作狀態的方法,這些方法以及描述如表2所示。

表2. ReentrantReadWriteLock展示內部工作狀態的方法

方法名稱 描述
int getReadLockCount() 返回當前讀鎖被獲取的次數。該次數不等於獲取讀鎖的線程數,比如:僅一個線程,它連續獲取(重進入)了n次讀鎖,那麼占據讀鎖的線程數是1,但該方法返回n
int getReadHoldCount() 返回當前線程獲取讀鎖的次數。該方法在Java 6 中加入到ReentrantReadWriteLock中,使用ThreadLocal保存當前線程獲取的次數,這也使得Java 6 的實現變得更加複雜
boolean isWriteLocked() 判斷寫鎖是否被獲取
int getWriteHoldCount() 返回當前寫鎖被獲取的次數

接下來通過一個緩存示例說明讀寫鎖的使用方式,示例代碼如代碼清單1所示。

代碼清單1. Cache.java

public class Cache {
	static Map<String, Object> map = new HashMap<String, Object>();
	static ReentrantReadWriteLock rwl = new ReentrantReadWriteLock();
	static Lock r = rwl.readLock();
	static Lock w = rwl.writeLock();
	// 獲取一個key對應的value
	public static final Object get(String key) {
		r.lock();
		try {
			return map.get(key);
		} finally {
			r.unlock();
		}
	}
	// 設置key對應的value,並返回舊有的value
	public static final Object put(String key, Object value) {
		w.lock();
		try {
			return map.put(key, value);
		} finally {
			w.unlock();
		}
	}
	// 清空所有的內容
	public static final void clear() {
		w.lock();
		try {
			map.clear();
		} finally {
			w.unlock();
		}
	}
}

上述示例中,Cache組合了一個非線程安全的HashMap作為緩存的實現,同時使用讀寫鎖的讀鎖和寫鎖來保證Cache是線程安全的。在讀操作get(String key)方法中,需要獲取讀鎖,這使得並發訪問該方法時不會被阻塞。寫操作put(String key, Object value)和clear()方法,在更新HashMap時必須提前獲取寫鎖,當寫鎖被獲取後,其他線程對於讀鎖和寫鎖的獲取均被阻塞,而隻有寫鎖被釋放之後,其他讀寫操作才能繼續。Cache使用讀寫鎖提升讀操作並發性,也保證每次寫操作對所有的讀寫操作的可見性,同時簡化了編程方式。

3. 讀寫鎖的實現分析

接下來將分析ReentrantReadWriteLock的實現,主要包括:讀寫狀態的設計、寫鎖的獲取與釋放、讀鎖的獲取與釋放以及鎖降級(以下沒有特別說明讀寫鎖均可認為是ReentrantReadWriteLock)。

3.1 讀寫狀態的設計

讀寫鎖同樣依賴自定義同步器來實現同步功能,而讀寫狀態就是其同步器的同步狀態。回想ReentrantLock中自定義同步器的實現,同步狀態表示鎖被一個線程重複獲取的次數,而讀寫鎖的自定義同步器需要在同步狀態(一個整型變量)上維護多個讀線程和一個寫線程的狀態,使得該狀態的設計成為讀寫鎖實現的關鍵。

如果在一個整型變量上維護多種狀態,就一定需要“按位切割使用”這個變量,讀寫鎖是將變量切分成了兩個部分,高16位表示讀,低16位表示寫,劃分方式如圖1所示。

圖1. 讀寫鎖狀態的劃分方式

1

        如圖1所示,當前同步狀態表示一個線程已經獲取了寫鎖,且重進入了兩次,同時也連續獲取了兩次讀鎖。讀寫鎖是如何迅速的確定讀和寫各自的狀態呢?答案是通過位運算。假設當前同步狀態值為S,寫狀態等於 S & 0x0000FFFF(將高16位全部抹去),讀狀態等於 S >>> 16(無符號補0右移16位)。當寫狀態增加1時,等於S + 1,當讀狀態增加1時,等於S + (1 << 16),也就是S + 0x00010000。

根據狀態的劃分能得出一個推論:S不等於0時,當寫狀態(S & 0x0000FFFF)等於0時,則讀狀態(S >>> 16)大於0,即讀鎖已被獲取。

3.2 寫鎖的獲取與釋放

寫鎖是一個支持重進入的排它鎖。如果當前線程已經獲取了寫鎖,則增加寫狀態。如果當前線程在獲取寫鎖時,讀鎖已經被獲取(讀狀態不為0)或者該線程不是已經獲取寫鎖的線程,則當前線程進入等待狀態,獲取寫鎖的代碼如代碼清單2所示。

代碼清單2. ReentrantReadWriteLock的tryAcquire方法

protected final boolean tryAcquire(int acquires) {
	Thread current = Thread.currentThread();
	int c = getState();
	int w = exclusiveCount(c);
	if (c != 0) {
		// 存在讀鎖或者當前獲取線程不是已經獲取寫鎖的線程
		if (w == 0 || current != getExclusiveOwnerThread())
			return false;
		if (w + exclusiveCount(acquires) &gt; MAX_COUNT)
			throw new Error("Maximum lock count exceeded");
		setState(c + acquires);
		return true;
	}
	if (writerShouldBlock() || !compareAndSetState(c, c + acquires)) {
		return false;
	}
	setExclusiveOwnerThread(current);
	return true;
}

該方法除了重入條件(當前線程為獲取了寫鎖的線程)之外,增加了一個讀鎖是否存在的判斷。如果存在讀鎖,則寫鎖不能被獲取,原因在於:讀寫鎖要確保寫鎖的操作對讀鎖可見,如果允許讀鎖在已被獲取的情況下對寫鎖的獲取,那麼正在運行的其他讀線程就無法感知到當前寫線程的操作。因此隻有等待其他讀線程都釋放了讀鎖,寫鎖才能被當前線程所獲取,而寫鎖一旦被獲取,則其他讀寫線程的後續訪問均被阻塞。

寫鎖的釋放與ReentrantLock的釋放過程基本類似,每次釋放均減少寫狀態,當寫狀態為0時表示寫鎖已被釋放,從而等待的讀寫線程能夠繼續訪問讀寫鎖,同時前次寫線程的修改對後續讀寫線程可見。

3.3 讀鎖的獲取與釋放

讀鎖是一個支持重進入的共享鎖,它能夠被多個線程同時獲取,在沒有其他寫線程訪問(或者寫狀態為0)時,讀鎖總會成功的被獲取,而所做的也隻是(線程安全的)增加讀狀態。如果當前線程已經獲取了讀鎖,則增加讀狀態。如果當前線程在獲取讀鎖時,寫鎖已被其他線程獲取,則進入等待狀態。獲取讀鎖的實現從Java 5到Java 6變得複雜許多,主要原因是新增了一些功能,比如:getReadHoldCount()方法,返回當前線程獲取讀鎖的次數。讀狀態是所有線程獲取讀鎖次數的總和,而每個線程各自獲取讀鎖的次數隻能選擇保存在ThreadLocal中,由線程自身維護,這使獲取讀鎖的實現變得複雜。因此,這裏將獲取讀鎖的代碼做了刪減,保留必要的部分,代碼如代碼清單3所示。

代碼清單3. ReentrantReadWriteLock的tryAcquireShared方法

protected final int tryAcquireShared(int unused) {
	for (;;) {
		int c = getState();
		int nextc = c + (1 &lt;&lt; 16);
		if (nextc &lt; c)
			throw new Error("Maximum lock count exceeded");
		if (exclusiveCount(c) != 0 &amp;&amp; owner != Thread.currentThread())
			return -1;
		if (compareAndSetState(c, nextc))
			return 1;
	}
}

在tryAcquireShared(int unused)方法中,如果其他線程已經獲取了寫鎖,則當前線程獲取讀鎖失敗,進入等待狀態。如果當前線程獲取了寫鎖或者寫鎖未被獲取,則當前線程(線程安全,依靠CAS保證)增加讀狀態,成功獲取讀鎖。

讀鎖的每次釋放均(線程安全的,可能有多個讀線程同時釋放讀鎖)減少讀狀態,減少的值是(1 << 16)。

3.4 鎖降級

鎖降級指的是寫鎖降級成為讀鎖。如果當前線程擁有寫鎖,然後將其釋放,最後再獲取讀鎖,這種分段完成的過程不能稱之為鎖降級。鎖降級是指把持住(當前擁有的)寫鎖,再獲取到讀鎖,隨後釋放(先前擁有的)寫鎖的過程。

接下來看一個鎖降級的示例:因為數據不常變化,所以多個線程可以並發的進行數據處理,當數據變更後,當前線程如果感知到數據變化,則進行數據的準備工作,同時其他處理線程被阻塞,直到當前線程完成數據的準備工作,示例代碼如代碼清單4所示。

代碼清單4. processData方法

public void processData() {
	readLock.lock();
	if (!update) {
		// 必須先釋放讀鎖
		readLock.unlock();
		// 鎖降級從寫鎖獲取到開始
		writeLock.lock();
		try {
			if (!update) {
				// 準備數據的流程(略)
				update = true;
			}
			readLock.lock();
		} finally {
			writeLock.unlock();
		}
		// 鎖降級完成,寫鎖降級為讀鎖
	}
	try {
		// 使用數據的流程(略)
	} finally {
		readLock.unlock();
	}
}

上述示例中,當數據發生變更後,update變量(布爾類型且volatile修飾)被設置為false,此時所有訪問processData()方法的線程都能夠感知到變化,但隻有一個線程能夠獲取到寫鎖,而其他線程會被阻塞在讀鎖和寫鎖的lock()方法上。當前程獲取寫鎖完成數據準備之後,再獲取讀鎖,隨後釋放寫鎖,完成鎖降級。

鎖降級中讀鎖的獲取是否必要呢?答案是必要的。主要原因是保證數據的可見性,如果當前線程不獲取讀鎖而是直接釋放寫鎖,假設此刻另一個線程(記作線程T)獲取了寫鎖並修改了數據,則當前線程無法感知線程T的數據更新。如果當前線程獲取讀鎖,即遵循鎖降級的步驟,則線程T將會被阻塞,直到當前線程使用數據並釋放讀鎖之後,線程T才能獲取寫鎖進行數據更新。

RentrantReadWriteLock不支持鎖升級(把持讀鎖、獲取寫鎖,最後釋放讀鎖的過程)。原因也是保證數據可見性,如果讀鎖已被多個線程獲取,其中任意線程成功獲取了寫鎖並更新了數據,則其更新對其他獲取到讀鎖的線程不可見。

最後更新:2017-05-22 10:03:46

  上一篇:go  《雲數據管理:挑戰與機遇》一第1章
  下一篇:go  《Redis官方文檔》翻譯邀請