無鎖有序鏈表的實現
無鎖有序鏈表可以保證元素的唯一性,使其可用於哈希表的桶,甚至直接作為一個效率不那麼高的map。普通鏈表的無鎖實現相對簡單點,因為插入元素可以在表頭插,而有序鏈表的插入則是任意位置。
本文主要基於論文High Performance Dynamic Lock-Free Hash Tables實現。
主要問題
鏈表的主要操作包含insert
和remove
,先簡單實現一個版本,就會看到問題所在,以下代碼隻用作示例:
struct node_t { key_t key; value_t val; node_t *next; }; int l_find(node_t **pred_ptr, node_t **item_ptr, node_t *head, key_t key) { node_t *pred = head; node_t *item = head->next; while (item) { int d = KEY_CMP(item->key, key); if (d >= 0) { *pred_ptr = pred; *item_ptr = item; return d == 0 ? TRUE : FALSE; } pred = item; item = item->next; } *pred_ptr = pred; *item_ptr = NULL; return FALSE; } int l_insert(node_t *head, key_t key, value_t val) { node_t *pred, *item, *new_item; while (TRUE) { if (l_find(&pred, &item, head, key)) { return FALSE; } new_item = (node_t*) malloc(sizeof(node_t)); new_item->key = key; new_item->val = val; new_item->next = item; // A. 如果pred本身被移除了 if (CAS(&pred->next, item, new_item)) { return TRUE; } free(new_item); } } int l_remove(node_t *head, key_t key) { node_t *pred, *item; while (TRUE) { if (!l_find(&pred, &item, head, key)) { return TRUE; } // B. 如果pred被移除;如果item也被移除 if (CAS(&pred->next, item, item->next)) { haz_free(item); return TRUE; } } }
l_find
函數返回查找到的前序元素和元素本身,代碼A和B雖然拿到了pred
和item
,但在CAS
的時候,其可能被其他線程移除。甚至,在l_find
過程中,其每一個元素都可能被移除。問題在於,任何時候拿到一個元素時,都不確定其是否還有效。元素的有效性包括其是否還在鏈表中,其指向的內存是否還有效。
解決方案
通過為元素指針增加一個有效性標誌位,配合CAS操作的互斥性,就可以解決元素有效性判定問題。
因為node_t
放在內存中是會對齊的,所以指向node_t
的指針值低幾位是不會用到的,從而可以在低幾位裏設置標誌,這樣在做CAS的時候,就實現了DCAS的效果,相當於將兩個邏輯上的操作變成了一個原子操作。想象下引用計數對象的線程安全性,其內包裝的指針是線程安全的,但對象本身不是。
CAS的互斥性,在若幹個線程CAS相同的對象時,隻有一個線程會成功,失敗的線程就可以以此判定目標對象發生了變更。改進後的代碼(代碼僅做示例用,不保證正確):
typedef size_t markable_t; // 最低位置1,表示元素被刪除 #define HAS_MARK(p) ((markable_t)p & 0x01) #define MARK(p) ((markable_t)p | 0x01) #define STRIP_MARK(p) ((markable_t)p & ~0x01) int l_insert(node_t *head, key_t key, value_t val) { node_t *pred, *item, *new_item; while (TRUE) { if (l_find(&pred, &item, head, key)) { return FALSE; } new_item = (node_t*) malloc(sizeof(node_t)); new_item->key = key; new_item->val = val; new_item->next = item; // A. 雖然find拿到了合法的pred,但是在以下代碼之前pred可能被刪除,此時pred->next被標記 // pred->next != item,該CAS會失敗,失敗後重試 if (CAS(&pred->next, item, new_item)) { return TRUE; } free(new_item); } return FALSE; } int l_remove(node_t *head, key_t key) { node_t *pred, *item; while (TRUE) { if (!l_find(&pred, &item, head, key)) { return FALSE; } node_t *inext = item->next; // B. 刪除item前先標記item->next,如果CAS失敗,那麼情況同insert一樣,有其他線程在find之後 // 刪除了item,失敗後重試 if (!CAS(&item->next, inext, MARK(inext))) { continue; } // C. 對同一個元素item刪除時,隻會有一個線程成功走到這裏 if (CAS(&pred->next, item, STRIP_MARK(item->next))) { haz_defer_free(item); return TRUE; } } return FALSE; } int l_find(node_t **pred_ptr, node_t **item_ptr, node_t *head, key_t key) { node_t *pred = head; node_t *item = head->next; hazard_t *hp1 = haz_get(0); hazard_t *hp2 = haz_get(1); while (item) { haz_set_ptr(hp1, pred); haz_set_ptr(hp2, item); /* 如果已被標記,那麼緊接著item可能被移除鏈表甚至釋放,所以需要重頭查找 */ if (HAS_MARK(item->next)) { return l_find(pred_ptr, item_ptr, head, key); } int d = KEY_CMP(item->key, key); if (d >= 0) { *pred_ptr = pred; *item_ptr = item; return d == 0 ? TRUE : FALSE; } pred = item; item = item->next; } *pred_ptr = pred; *item_ptr = NULL; return FALSE; }
haz_get
、haz_set_ptr
之類的函數是一個hazard pointer實現,用於支持多線程下內存的GC。上麵的代碼中,要刪除一個元素item
時,會標記item->next
,從而使得insert
時中那個CAS
不需要做任何調整。總結下這裏的線程競爭情況:
-
insert
中find
到正常的pred
及item
,pred->next == item
,然後在CAS
前有線程刪除了pred
,此時pred->next == MARK(item)
,CAS
失敗,重試;刪除分為2種情況:a) 從鏈表移除,得到標記,pred
可繼續訪問;b)pred
可能被釋放內存,此時再使用pred
會錯誤。為了處理情況b,所以引入了類似hazard pointer的機製,可以有效保障任意一個指針p
隻要還有線程在使用它,它的內存就不會被真正釋放 -
insert
中有多個線程在pred
後插入元素,此時同樣由insert
中的CAS
保證,這個不多說 -
remove
中情況同insert
,find
拿到了有效的pred
和next
,但在CAS
的時候pred
被其他線程刪除,此時情況同insert
,CAS
失敗,重試 - 任何時候改變鏈表結構時,無論是
remove
還是insert
,都需要重試該操作 -
find
中遍曆時,可能會遇到被標記刪除的item
,此時item
根據remove
的實現很可能被刪除,所以需要重頭開始遍曆
ABA問題
ABA問題還是存在的,insert
中:
if (CAS(&pred->next, item, new_item)) { return TRUE; }
如果CAS
之前,pred
後的item
被移除,又以相同的地址值加進來,但其value變了,此時CAS
會成功,但鏈表可能就不是有序的了。pred->val < new_item->val > item->val
為了解決這個問題,可以利用指針值地址對齊的其他位來存儲一個計數,用於表示pred->next
的改變次數。當insert
拿到pred
時,pred->next
中存儲的計數假設是0,CAS
之前其他線程移除了pred->next
又新增回了item
,此時pred->next
中的計數增加,從而導致insert
中CAS
失敗。
// 最低位留作刪除標誌 #define MASK ((sizeof(node_t) - 1) & ~0x01) #define GET_TAG(p) ((markable_t)p & MASK) #define TAG(p, tag) ((markable_t)p | (tag)) #define MARK(p) ((markable_t)p | 0x01) #define HAS_MARK(p) ((markable_t)p & 0x01) #define STRIP_MARK(p) ((node_t*)((markable_t)p & ~(MASK | 0x01)))
remove
的實現:
/* 先標記再刪除 */ if (!CAS(&sitem->next, inext, MARK(inext))) { continue; } int tag = GET_TAG(pred->next) + 1; if (CAS(&pred->next, item, TAG(STRIP_MARK(sitem->next), tag))) { haz_defer_free(sitem); return TRUE; }
insert
中也可以更新pred->next
的計數。
總結
無鎖的實現,本質上都會依賴於CAS
的互斥性。從頭實現一個lock free的數據結構,可以深刻感受到lock free實現的tricky。最終代碼可以從這裏github獲取。代碼中為了簡單,實現了一個不是很強大的hazard pointer,可以參考之前的博文。
最後更新:2017-05-22 16:37:26