JVM實用參數(二)參數分類和即時(JIT)編譯器診斷
在這個係列的第二部分,我來介紹一下HotSpot JVM提供的不同類別的參數。我同樣會討論一些關於JIT編譯器診斷的有趣參數。
JVM 參數分類
HotSpot JVM 提供了三類參數。第一類包括了標準參數。顧名思義,標準參數中包括功能和輸出的參數都是很穩定的,很可能在將來的JVM版本中不會改變。你可以用java命令(或者是用 java -help)檢索出所有標準參數。我們在第一部分中已經見到過一些標準參數,例如:-server。
第二類是X參數,非標準化的參數在將來的版本中可能會改變。所有的這類參數都以-X開始,並且可以用java -X來檢索。注意,不能保證所有參數都可以被檢索出來,其中就沒有-Xcomp。
第三類是包含XX參數(到目前為止最多的),它們同樣不是標準的,甚至很長一段時間內不被列出來(最近,這種情況有改變 ,我們將在本係列的第三部分中討論它們)。然而,在實際情況中X參數和XX參數並沒有什麼不同。X參數的功能是十分穩定的,然而很多XX參數仍在實驗當中(主要是JVM的開發者用於debugging和調優JVM自身的實現)。值的一讀的介紹非標準參數的文檔 HotSpot JVM documentation,其中明確的指出XX參數不應該在不了解的情況下使用。這是真的,並且我認為這個建議同樣適用於X參數(同樣一些標準參數也是)。不管類別是什麼,在使用參數之前應該先了解它可能產生的影響。
用一句話來說明XX參數的語法。所有的XX參數都以”-XX:”開始,但是隨後的語法不同,取決於參數的類型。
- 對於布爾類型的參數,我們有”+”或”-“,然後才設置JVM選項的實際名稱。例如,-XX:+<name>用於激活<name>選項,而-XX:-<name>用於注銷選項。
- 對於需要非布爾值的參數,如string或者integer,我們先寫參數的名稱,後麵加上”=”,最後賦值。例如, -XX:<name>=<value>給<name>賦值<value>。
現在讓我們來看看JIT編譯方麵的一些XX參數。
-XX:+PrintCompilation and -XX:+CITime
當一個Java應用運行時,非常容易查看JIT編譯工作。通過設置-XX:+PrintCompilation,我們可以簡單的輸出一些關於從字節碼轉化成本地代碼的編譯過程。我們來看一個服務端VM運行的例子:
$ java -server -XX:+PrintCompilation Benchmark 1 java.lang.String::hashCode (64 bytes) 2 java.lang.AbstractStringBuilder::stringSizeOfInt (21 bytes) 3 java.lang.Integer::getChars (131 bytes) 4 java.lang.Object::<init> (1 bytes) --- n java.lang.System::arraycopy (static) 5 java.util.HashMap::indexFor (6 bytes) 6 java.lang.Math::min (11 bytes) 7 java.lang.String::getChars (66 bytes) 8 java.lang.AbstractStringBuilder::append (60 bytes) 9 java.lang.String::<init> (72 bytes) 10 java.util.Arrays::copyOfRange (63 bytes) 11 java.lang.StringBuilder::append (8 bytes) 12 java.lang.AbstractStringBuilder::<init> (12 bytes) 13 java.lang.StringBuilder::toString (17 bytes) 14 java.lang.StringBuilder::<init> (18 bytes) 15 java.lang.StringBuilder::append (8 bytes) [...] 29 java.util.regex.Matcher::reset (83 bytes) |
每當一個方法被編譯,就輸出一行-XX:+PrintCompilation。每行都包含順序號(唯一的編譯任務ID)和已編譯方法的名稱和大小。因此,順序號1,代表編譯String類中的hashCode方法到原生代碼的信息。根據方法的類型和編譯任務打印額外的信息。例如,本地的包裝方法前方會有”n”參數,像上麵的System::arraycopy一樣。注意這樣的方法不會包含順序號和方法占用的大小,因為它不需要編譯為本地代碼。同樣可以看到被重複編譯的方法,例如StringBuilder::append順序號為11和15。輸出在順序號29時停止 ,這表明在這個Java應用運行時總共需要編譯29個方法。
沒有官方的文檔關於-XX:+PrintCompilation,但是這個描述是對於此參數比較好的。我推薦更深入學習一下。
JIT編譯器輸出幫助我們理解客戶端VM與服務端VM的一些區別。用服務端VM,我們的應用例子輸出了29行,同樣用客戶端VM,我們會得到55行。這看起來可能很怪,因為服務端VM應該比客戶端VM做了“更多”的編譯。然而,由於它們各自的默認設置,服務端VM在判斷方法是不是熱點和需不需要編譯時比客戶端VM觀察方法的時間更長。因此,在使用服務端VM時,一些潛在的方法會稍後編譯就不奇怪了。
通過另外設置-XX:+CITime,我們可以在JVM關閉時得到各種編譯的統計信息。讓我們看一下一個特定部分的統計:
$ java -server -XX:+CITime Benchmark [...] Accumulated compiler times (for compiled methods only) ------------------------------------------------ Total compilation time : 0.178 s Standard compilation : 0.129 s, Average : 0.004 On stack replacement : 0.049 s, Average : 0.024 [...] |
總共用了0.178s(在29個編譯任務上)。這些,”on stack replacement”占用了0.049s,即編譯的方法目前在堆棧上用去的時間。這種技術並不是簡單的實現性能顯示,實際上它是非常重要的。沒有”on stack replacement”,方法如果要執行很長時間(比如,它們包含了一個長時間運行的循環),它們運行時將不會被它們編譯過的副本替換。
再一次,客戶端VM與服務端VM的比較是非常有趣的。客戶端VM相應的數據表明,即使有55個方法被編譯了,但這些編譯總共用了隻有0.021s。服務端VM做的編譯少但是用的時間卻比客戶端VM多。這個原因是,使用服務端VM在生成本地代碼時執行了更多的優化。
在本係列的第一部分,我們已經學了-Xint和-Xcomp參數。結合使用-XX:+PrintCompilation和-XX:+CITime,在這兩個情況下(校對者注,客戶端VM與服務端VM),我們能對JIT編譯器的行為有更好的了解。使用-Xint,-XX:+PrintCompilation在這兩種情況下會產生0行輸出。同樣的,使用-XX:+CITime時,證實在編譯上沒有花費時間。現在換用-Xcomp,輸出就完全不同了。在使用客戶端VM時會產生726行輸出,然後沒有更多的,這是因為每個相關的方法都被編譯了。使用服務端VM,我們甚至能得到993行輸出,這告訴我們更積極的優化被執行了。同樣,JVM 拆機(JVM teardown)時打印出的統計顯示了兩個VM的巨大不同。考慮服務端VM的運行:
$ java -server -Xcomp -XX:+CITime Benchmark [...] Accumulated compiler times (for compiled methods only) ------------------------------------------------ Total compilation time : 1.567 s Standard compilation : 1.567 s, Average : 0.002 On stack replacement : 0.000 s, Average : -1.#IO [...] |
使用-Xcomp編譯用了1.567s,這是使用默認設置(即,混合模式)的10倍。同樣,應用程序的運行速度要比用混合模式的慢。相比較之下,客戶端VM使用-Xcomp編譯726個方法隻用了0.208s,甚至低於使用-Xcomp的服務端VM。
補充一點,這裏沒有”on stack replacement”發生,因為每一個方法在第一次調用時被編譯了。損壞的輸出“Average: -1.#IO”(正確的是:0)再一次表明了,非標準化的輸出參數不是非常可靠。
-XX:+UnlockExperimentalVMOptions
有些時候當設置一個特定的JVM參數時,JVM會在輸出“Unrecognized VM option”後終止。如果發生了這種情況,你應該首先檢查你是否輸錯了參數。然而,如果參數輸入是正確的,並且JVM並不識別,你或許需要設置-XX:+UnlockExperimentalVMOptions 來解鎖參數。我不是非常清楚這個安全機製的作用,但我猜想這個參數如果不正確使用可能會對JVM的穩定性有影響(例如,他們可能會過多的寫入debug輸出的一些日誌文件)。
有一些參數隻是在JVM開發時用,並不實際用於Java應用。如果一個參數不能被 -XX:+UnlockExperimentalVMOptions 開啟,但是你真的需要使用它,此時你可以嚐試使用debug版本的JVM。對於Java 6 HotSpot JVM你可以從這裏找到。
-XX:+LogCompilation and -XX:+PrintOptoAssembly
如果你在一個場景中發現使用 -XX:+PrintCompilation,不能夠給你足夠詳細的信息,你可以使用 -XX:+LogCompilation把擴展的編譯輸出寫到“hotspot.log”文件中。除了編譯方法的很多細節之外,你也可以看到編譯器線程啟動的任務。注意-XX:+LogCompilation 需要使用-XX:+UnlockExperimentalVMOptions來解鎖。
JVM甚至允許我們看到從字節碼編譯生成到本地代碼。使用-XX:+PrintOptoAssembly,由編譯器線程生成的本地代碼被輸出並寫到“hotspot.log”文件中。使用這個參數要求運行的服務端VM是debug版本。我們可以研究-XX:+PrintOptoAssembly的輸出,以至於了解JVM實際執行什麼樣的優化,例如,關於死代碼的消除。一個非常有趣的文章提供了一個例子。
關於XX參數的更多信息
如果這篇文章勾起了你的興趣,你可以自己看一下HotSpot JVM的XX 參數。這裏是一個很好的起點。
最後更新:2017-05-24 09:31:47