閱讀519 返回首頁    go 阿裏雲 go 技術社區[雲棲]


Java多線程問題總結(上)

前言


Java多線程分類中寫了21篇多線程的文章,21篇文章的內容很多,個人認為,學習,內容越多、越雜的知識,越需要進行深刻的總結,這樣才能記憶深刻,將知識變成自己的。這篇文章主要是對多線程的問題進行總結的,因此羅列了40個多線程的問題。


這些多線程的問題,有些來源於各大網站、有些來源於自己的思考。可能有些問題網上有、可能有些問題對應的答案也有、也可能有些各位網友也都看過,但是本文寫作的重心就是所有的問題都會按照自己的理解回答一遍,不會去看網上的答案,因此可能有些問題講的不對,能指正的希望大家不吝指教。


1000


40個問題匯總


1、多線程有什麼用?


一個可能在很多人看來很扯淡的一個問題:我會用多線程就好了,還管它有什麼用?在我看來,這個回答更扯淡。所謂"知其然知其所以然","會用"隻是"知其然","為什麼用"才是"知其所以然",隻有達到"知其然知其所以然"的程度才可以說是把一個知識點運用自如。OK,下麵說說我對這個問題的看法:


(1)發揮多核CPU的優勢

隨著工業的進步,現在的筆記本、台式機乃至商用的應用服務器至少也都是雙核的,4核、8核甚至16核的也都不少見,如果是單線程的程序,那麼在雙核CPU上就浪費了50%,在4核CPU上就浪費了75%。單核CPU上所謂的"多線程"那是假的多線程,同一時間處理器隻會處理一段邏輯,隻不過線程之間切換得比較快,看著像多個線程"同時"運行罷了。多核CPU上的多線程才是真正的多線程,它能讓你的多段邏輯同時工作,多線程,可以真正發揮出多核CPU的優勢來,達到充分利用CPU的目的。


(2)防止阻塞

從程序運行效率的角度來看,單核CPU不但不會發揮出多線程的優勢,反而會因為在單核CPU上運行多線程導致線程上下文的切換,而降低程序整體的效率。但是單核CPU我們還是要應用多線程,就是為了防止阻塞。試想,如果單核CPU使用單線程,那麼隻要這個線程阻塞了,比方說遠程讀取某個數據吧,對端遲遲未返回又沒有設置超時時間,那麼你的整個程序在數據返回回來之前就停止運行了。多線程可以防止這個問題,多條線程同時運行,哪怕一條線程的代碼執行讀取數據阻塞,也不會影響其它任務的執行。


(3)便於建模

這是另外一個沒有這麼明顯的優點了。假設有一個大的任務A,單線程編程,那麼就要考慮很多,建立整個程序模型比較麻煩。但是如果把這個大的任務A分解成幾個小任務,任務B、任務C、任務D,分別建立程序模型,並通過多線程分別運行這幾個任務,那就簡單很多了。

如果你想學習Java可以來這個群,首先是二二零,中間是一四二,最後是九零六,裏麵可以學習和交流,也有資料可以下載。



2、創建線程的方式


比較常見的一個問題了,一般就是兩種:

(1)繼承Thread類

(2)實現Runnable接口


至於哪個好,不用說肯定是後者好,因為實現接口的方式比繼承類的方式更靈活,也能減少程序之間的耦合度,麵向接口編程也是設計模式6大原則的核心。



3、start()方法和run()方法的區別


隻有調用了start()方法,才會表現出多線程的特性,不同線程的run()方法裏麵的代碼交替執行。如果隻是調用run()方法,那麼代碼還是同步執行的,必須等待一個線程的run()方法裏麵的代碼全部執行完畢之後,另外一個線程才可以執行其run()方法裏麵的代碼。



4、Runnable接口和Callable接口的區別


有點深的問題了,也看出一個Java程序員學習知識的廣度。

Runnable接口中的run()方法的返回值是void,它做的事情隻是純粹地去執行run()方法中的代碼而已;Callable接口中的call()方法是有返回值的,是一個泛型,和Future、FutureTask配合可以用來獲取異步執行的結果。


這其實是很有用的一個特性,因為多線程相比單線程更難、更複雜的一個重要原因就是因為多線程充滿著未知性,某條線程是否執行了?某條線程執行了多久?某條線程執行的時候我們期望的數據是否已經賦值完畢?無法得知,我們能做的隻是等待這條多線程的任務執行完畢而已。而Callable+Future/FutureTask卻可以獲取多線程運行的結果,可以在等待時間太長沒獲取到需要的數據的情況下取消該線程的任務,真的是非常有用。



5、CyclicBarrier和CountDownLatch的區別


兩個看上去有點像的類,都在java.util.concurrent下,都可以用來表示代碼運行到某個點上,二者的區別在於:

(1)CyclicBarrier的某個線程運行到某個點上之後,該線程即停止運行,直到所有的線程都到達了這個點,所有線程才重新運行;CountDownLatch則不是,某線程運行到某個點上之後,隻是給某個數值-1而已,該線程繼續運行

(2)CyclicBarrier隻能喚起一個任務,CountDownLatch可以喚起多個任務

(3)CyclicBarrier可重用,CountDownLatch不可重用,計數值為0該CountDownLatch就不可再用了



6、volatile關鍵字的作用


一個非常重要的問題,是每個學習、應用多線程的Java程序員都必須掌握的。理解volatile關鍵字的作用的前提是要理解Java內存模型,這裏就不講Java內存模型了,可以參見第31點,volatile關鍵字的作用主要有兩個:

(1)多線程主要圍繞可見性和原子性兩個特性而展開,使用volatile關鍵字修飾的變量,保證了其在多線程之間的可見性,即每次讀取到volatile變量,一定是最新的數據

(2)代碼底層執行不像我們看到的高級語言----Java程序這麼簡單,它的執行是Java代碼-->字節碼-->根據字節碼執行對應的C/C++代碼-->C/C++代碼被編譯成匯編語言-->和硬件電路交互,現實中,為了獲取更好的性能JVM可能會對指令進行重排序,多線程下可能會出現一些意想不到的問題。使用volatile則會對禁止語義重排序,當然這也一定程度上降低了代碼執行效率


從實踐角度而言,volatile的一個重要作用就是和CAS結合,保證了原子性,詳細的可以參見java.util.concurrent.atomic包下的類,比如AtomicInteger。



7、什麼是線程安全


又是一個理論的問題,各式各樣的答案有很多,我給出一個個人認為解釋地最好的:如果你的代碼在多線程下執行和在單線程下執行永遠都能獲得一樣的結果,那麼你的代碼就是線程安全的。

這個問題有值得一提的地方,就是線程安全也是有幾個級別的:

(1)不可變

像String、Integer、Long這些,都是final類型的類,任何一個線程都改變不了它們的值,要改變除非新創建一個,因此這些不可變對象不需要任何同步手段就可以直接在多線程環境下使用

(2)絕對線程安全

不管運行時環境如何,調用者都不需要額外的同步措施。要做到這一點通常需要付出許多額外的代價,Java中標注自己是線程安全的類,實際上絕大多數都不是線程安全的,不過絕對線程安全的類,Java中也有,比方說CopyOnWriteArrayList、CopyOnWriteArraySet

(3)相對線程安全

相對線程安全也就是我們通常意義上所說的線程安全,像Vector這種,add、remove方法都是原子操作,不會被打斷,但也僅限於此,如果有個線程在遍曆某個Vector、有個線程同時在add這個Vector,99%的情況下都會出現ConcurrentModificationException,也就是fail-fast機製。

(4)線程非安全

這個就沒什麼好說的了,ArrayList、LinkedList、HashMap等都是線程非安全的類



8、Java中如何獲取到線程dump文件


死循環、死鎖、阻塞、頁麵打開慢等問題,打線程dump是最好的解決問題的途徑。所謂線程dump也就是線程堆棧,獲取到線程堆棧有兩步:

(1)獲取到線程的pid,可以通過使用jps命令,在Linux環境下還可以使用ps -ef | grep java

(2)打印線程堆棧,可以通過使用jstack pid命令,在Linux環境下還可以使用kill -3 pid

另外提一點,Thread類提供了一個getStackTrace()方法也可以用於獲取線程堆棧。這是一個實例方法,因此此方法是和具體線程實例綁定的,每次獲取獲取到的是具體某個線程當前運行的堆棧,



9、一個線程如果出現了運行時異常會怎麼樣


如果這個異常沒有被捕獲的話,這個線程就停止執行了。另外重要的一點是:如果這個線程持有某個某個對象的監視器,那麼這個對象監視器會被立即釋放



10、如何在兩個線程之間共享數據


通過在線程之間共享對象就可以了,然後通過wait/notify/notifyAll、await/signal/signalAll進行喚起和等待,比方說阻塞隊列BlockingQueue就是為線程之間共享數據而設計的



11、sleep方法和wait方法有什麼區別


這個問題常問,sleep方法和wait方法都可以用來放棄CPU一定的時間,不同點在於如果線程持有某個對象的監視器,sleep方法不會放棄這個對象的監視器,wait方法會放棄這個對象的監視器



12、生產者消費者模型的作用是什麼


這個問題很理論,但是很重要:

(1)通過平衡生產者的生產能力和消費者的消費能力來提升整個係統的運行效率,這是生產者消費者模型最重要的作用

(2)解耦,這是生產者消費者模型附帶的作用,解耦意味著生產者和消費者之間的聯係少,聯係越少越可以獨自發展而不需要收到相互的製約



13、ThreadLocal有什麼用


簡單說ThreadLocal就是一種以空間換時間的做法,在每個Thread裏麵維護了一個以開地址法實現的ThreadLocal.ThreadLocalMap,把數據進行隔離,數據不共享,自然就沒有線程安全方麵的問題了


14、為什麼wait()方法和notify()/notifyAll()方法要在同步塊中被調用

這是JDK強製的,wait()方法和notify()/notifyAll()方法在調用前都必須先獲得對象的鎖


15、wait()方法和notify()/notifyAll()方法在放棄對象監視器時有什麼區別wait()方法和notify()/notifyAll()方法在放棄對象監視器的時候的區別在於:wait()方法立即釋放對象監視器,notify()/notifyAll()方法則會等待線程剩餘代碼執行完畢才會放棄對象監視器。



16、為什麼要使用線程池


避免頻繁地創建和銷毀線程,達到線程對象的重用。另外,使用線程池還可以根據項目靈活地控製並發的數目。



17、怎麼檢測一個線程是否持有對象監視器


我也是在網上看到一道多線程麵試題才知道有方法可以判斷某個線程是否持有對象監視器:Thread類提供了一個holdsLock(Object obj)方法,當且僅當對象obj的監視器被某條線程持有的時候才會返回true,注意這是一個static方法,這意味著"某條線程"指的是當前線程。



18、synchronized和ReentrantLock的區別


synchronized是和if、else、for、while一樣的關鍵字,ReentrantLock是類,這是二者的本質區別。既然ReentrantLock是類,那麼它就提供了比synchronized更多更靈活的特性,可以被繼承、可以有方法、可以有各種各樣的類變量,ReentrantLock比synchronized的擴展性體現在幾點上:

(1)ReentrantLock可以對獲取鎖的等待時間進行設置,這樣就避免了死鎖

(2)ReentrantLock可以獲取各種鎖的信息

(3)ReentrantLock可以靈活地實現多路通知


另外,二者的鎖機製其實也是不一樣的。ReentrantLock底層調用的是Unsafe的park方法加鎖,synchronized操作的應該是對象頭中mark word,這點我不能確定。



19、ConcurrentHashMap的並發度是什麼


ConcurrentHashMap的並發度就是segment的大小,默認為16,這意味著最多同時可以有16條線程操作ConcurrentHashMap,這也是ConcurrentHashMap對Hashtable的最大優勢,任何情況下,Hashtable能同時有兩條線程獲取Hashtable中的數據嗎?

最後更新:2017-08-13 22:50:07

  上一篇:go  揭秘:背靠穀歌拿著大筆預算的Nest這兩年都在忙些啥?
  下一篇:go  從學渣到白帽黑客掌門 他到底經曆了什麼