閱讀785 返回首頁    go 阿裏雲 go 技術社區[雲棲]


打造高性能Java應用需掌握的5大知識

這篇文章節選自《java performance》,對java性能比較關心的同學大概都知道這本書,性能這個東西可能是很多同學在日常寫java code的時候很少去關心的,但是在我們寫code的過程中確又時時離不開對程序性能的影響,小到我們使用位運算來實現算術運算,大到我們對JAVA代碼的總體架構設計,性能其實離我們很近。本片文章主要提到幾個點,主要是在性能領域我們比較關注的一些問題,並且是有啟發性的,如果同學對性能較感興趣,那麼我們可以一起深入研究各個點。

對於性能調優,通常會有三個步驟:1,性能監控;2,性能剖析;3,性能調優

我們對於操作係統的性能關注主要在下麵幾個點上:CPU利用率、CPU調度執行隊列、內存利用率、網絡I/O、磁盤I/O。

1.CPU利用率

對於一個應用來說,為了讓應用達到最好的性能和可擴展性,我們不僅僅要充分利用CPU周期內可用的部分,而且要讓這部分CPU的使用更有價值,而不是浪費。能夠讓CPU的周期利用的更充分對於多線程應用運行在多處理器和多核係統上至很有挑戰性的。另外,當CPU達到飽和狀態的時候並不能說明CPU的性能和伸縮性已經達到了最佳的狀態。為了區分應用是如何利用CPU資源的,我們必須從操作係統級別來檢測。在很多操作係統上,CPU的利用率統計報告通常包括用戶和係統或內核對操作係統的使用。用戶對CPU的使用是指應用用來執行應用代碼執行所需要的時間。相比之下,內核和係統對CPU的使用是指應用用來執行操作係統內核代碼鎖花費的時間。高的內核或者係統CPU使用率可以表明共享資源緊迫,或者是有大量的I/O設備交互。理想的狀態為了提高應用的性能和伸縮性,讓內核或係統CPU時間為0%,因為花在執行內核或係統代碼的時間是可以用來執行應用代碼的。因此CPU使用優化的一個正確方向就是盡可能減少CPU花在執行內核代碼或者係統代碼上的時間。

對於計算密集型應用,性能監控比監測用戶CPU使用和內核或係統CPU使用要更深層次,在計算密集型應用中,我們需要監測CPU時鍾周期內的執行執行條數(Instructions per clock;IPC)或者是每條CPU執行所使用的CPU周期(cycles per instruction;CPI)。對於計算密集型應用來說我們從這兩個維度來監測CPU是不錯的選擇,因為現代操作係統的打包CPU性能報告工具通常隻會打印CPU的利用率,而不會打印CPU周期內CPU用來執行指令的時間。這意味著當CPU正在等待內存中的數據的時候,操作係統CPU性能報告工具也會認為CPU是正在使用的狀態,我們把這個場景叫做“Stall”,“Stall”場景經常會發生,比如在CPU正在執行指令的任何時候,隻要是指令需要的數據沒有準備好,也就是沒有在寄存器或者CPU緩存內,都會發生“Stall”場景。

如果你想學習java可以來這個群,首先是532,中間是259,最後是952,裏麵可以學習和交流,也有資料可以下載

當“Stall”場景發生的時候CPU會浪費時鍾周期,因為CPU必須要等待指令需要的數據到達寄存器或者緩衝器。而且在這個場景中,數百個CPU時鍾周期被浪費是很正常的事情,因此在計算密集型應用中,提高性能的策略是減少“Stall”場景的發生或者是增強CPU的緩存使用從而使得更少的CPU周期因為等待數據而浪費掉。這類的性能監控知識已經超越了本書的內容,需要性能專家的幫助了。然而,後麵講到的Oracle Solaris Studio Performance Analyzer這種性能剖析工具將會包括此類數據。

2.CPU調度隊列

除了對CPU使用的監控,我們也可以通過監控CPU執行隊列來檢查係統是否已經滿負載。執行隊列是用來存儲輕量級進程,這些進程通常是已經準備好執行了但是正在等待CPU調度而在調度隊列等待的一種狀態,當輕量級進程別當前處理器能來得及處理的數量更多的時候,調度隊列將會產生。比較深的CPU調度隊列表明係統已經滿負荷了。係統的執行隊列深度等於虛擬處理器執行不了的等待數,虛擬處理器數等於係統的硬件線程數。我們可以用java的api來拿到虛擬處理器數,Runtime.avaliableProcessors()。當執行隊列深度大於虛擬處理器個數的四倍或更多的時候,操作係統將會出現反應遲鈍的現象。

對於CPU調度隊列的檢測的一個通用指導是當我們發現隊列深度高於虛擬進程數一倍的時候就要注意了,但是沒有必要立即采取行動。當大於三倍或四倍或者更高的時候就要注意了,解決問題刻不容緩。

通常有兩個可選的途徑來觀察隊列的深度,第一個是通過增加CPU來分擔負載或者減少對現有CPU的負載。這種途徑從本質上減少了每個執行單元的負載線程數,從而減少執行執行隊列的深度。

另外的一種途徑是通過剖析係統運行的應用來增加CPU的使用率,換個說法就是尋找一種可以減少花費在垃圾回收上的CPU周期,或者尋找更好的算法來以更少的CPU周期來執行CPU指令。性能專家通常專注後麵的一種途徑:減少代碼的執行路徑長度和更好的CPU指令選擇。JAVA程序員可以通過更好的執行算法和數據結構來提高代碼的執行效率。

3.內存利用率

除了CPU的使用率,係統的內存屬性也需要被監控,這些屬性包括比如:分頁、交換、鎖、多線程引起的上下文交換等。

交換通常發生在當應用需要的內存大於實際的物理內存的時候,處理這種情況操作係統通常會配置一個相應的區域叫做交換區。交換區通常位於物理磁盤上,當物理內存內應用耗盡的時候,操作係統會將一部分內存數據暫時交換到磁盤空間上,這部分內存區域通常是訪問頻率最低的一塊區域,而不會影響比較“忙”的內存區域;當被交換到磁盤區域的內存又被應用訪問的時候,這個時候就需要從磁盤交換區將以頁為單位讀入內存,交換會影響應用的性能。

虛擬機的垃圾收集器在交換的時候性能非常差,因為垃圾收集器所訪問的大部分區域都是不可達的,也就是垃圾收集器會引起交換活動的發生。場景是戲劇性的,如果垃圾收集的堆區域已經被交換到了磁盤空間,這個時候將會以頁為單位發生交換,這樣才能夠被垃圾收集器所掃描到,在交換的過程中會戲劇性的引發垃圾收集器的收集時間延長,這個時候如果垃圾收集器是“Stop The World”(使得應用響應停止)的,那麼這個時間就會被延長。

4.網絡I/O

分布式JAVA應用的性能和伸縮性會受到網絡帶寬和網絡性能的限製。例如,如果我們往網絡接口發送比他能夠處理的更多的數據包,數據包將會堆積在操作係統的緩衝區內,這將會引發應用延遲,另外其他的情況也會導致網絡應用的延遲。

區分和監控的工具通常在操作係統的打包工具中很難找到。盡管linux提供了netstat命令,linux和solaris都提供了網絡使用情況的實現,他們都提供了包括每秒發包、接包、錯包、衝突等信息的統計。在以太網中,一小部分包衝突是很正常的現象。如果錯包情況比較多那可能是網卡有問題了。同時,盡管netstat可以統計網絡接口的發送和接收數據情況,這很難斷定網卡是否被充分利用。例如,如果netstat -i顯示現在每秒有2500個包從網卡發出,但是我們仍然無法判斷當前的網絡利用率是100%還是1%,我們僅僅能夠知道目前有流量。這僅僅是在不知道網絡包大小的情況下能夠得到的結論。簡單的說我們無法通過linux和solaris提供的netstat來判斷當前網絡是否影響了性能。我們需要一些其他的工具在我們的JAVA應用運行的過程中來監測網絡。

5.磁盤I/O

如果應用有對磁盤進行操作,我們需要對磁盤進行監控,來監測可能出現的磁盤性能問題。一些應用是I/O密集型的,比如數據庫。磁盤的使用通常還存在於應用日誌係統,日誌通常是我們用來記錄係統運行過程中重要信息的。

最後更新:2017-10-18 15:33:44

  上一篇:go  這是史上最全的雲棲大會珍貴花絮,看完倍感驕傲!
  下一篇:go  WiFi網絡WPA2 KRACK漏洞分析報告