61
阿裏雲
技術社區[雲棲]
最簡單例子圖解JVM內存分配和回收
一、簡介
JVM采用分代垃圾回收。在JVM的內存空間中把堆空間分為年老代和年輕代。將大量(據說是90%以上)創建了沒多久就會消亡的對象存儲在年輕代,而年老代中存放生命周期長久的實例對象。年輕代中又被分為Eden區(聖經中的伊甸園)、和兩個Survivor區。新的對象分配是首先放在Eden區,Survivor區作為Eden區和Old區的緩衝,在Survivor區的對象經曆若幹次收集仍然存活的,就會被轉移到年老區。

簡單講,就是生命期短的對象放在一起,將少數生命期長的對象放在一起,分別采用不同的回收策略。生命期短的對象回收頻率比較高,生命期長的對象采用比較低回收頻率,生命期短的對象被嚐試回收幾次發現還存活,則被移到另外一個地方去存起來。就像現在夏天了,勤勞的douma把doudou和douba常穿的衣服放在順手的地方,把冬天的衣服打包放在櫃子另一個地方。雖然把doudou的小衣服類比成虛擬機裏的對象有點不合適,大致意思應該就是這樣。

本文中通過最簡單的一個例子來demo下這個過程,代碼很短,很簡單,希望剖析的細一點,包括每一步操作後對象的分配和回收對內存堆產生的影響。設定上包括對堆中年輕代(年輕代中eden區和survivor區)、年老代大小的設定,以及設置閾值控製年輕代到年老代的晉升。
二、示例代碼
下麵是最簡單的代碼,通過代碼的每一步的執行來剖析其中的規則。
01 |
package com.idouba.jvm.demo;
|
05 |
* Use shortest code demo jvm allocation, gc, and someting in gc.
|
08 |
* 1) sizing of young generation (eden space,survivor space),old generation.
|
09 |
* 2) allocation in eden space, gc in young generation,
|
10 |
* 3) working with survivor space and with old generation.
|
13 |
public class SimpleJVMArg {
|
18 |
public static void main(String[] args)
|
24 |
* VM arg:-verbose:gc -Xms200M -Xmx200M -Xmn100M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=1 -XX:+PrintTenuringDistribution
|
27 |
@SuppressWarnings ( "unused" )
|
28 |
public static void demo() {
|
30 |
final int tenMB = 10 * 1024 * 1024 ;
|
32 |
byte [] alloc1, alloc2, alloc3;
|
34 |
alloc1 = new byte [tenMB / 5 ];
|
35 |
alloc2 = new byte [ 5 * tenMB];
|
36 |
alloc3 = new byte [ 4 * tenMB];
|
38 |
alloc3 = new byte [ 6 * tenMB];
|
三、執行輸出
通過jvm 參數設定幾個區域的大小,結合代碼執行可以觀察到對象在堆上分配和回收的過程。執行參數如下:
-verbose:gc -Xms200M -Xmx200M -Xmn100M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:+PrintTenuringDistribution
通過設這-Xms200M -Xmx200M 設置Java堆大小為200M,不可擴展,-Xmn100M設置其中100M分配給新生代,則200-100=100M,即剩下的100M分配給老年代。-XX:SurvivorRatio=8設置了新生代中eden與survivor的空間比例是1:8。
執行上述代碼結果如下:
[GC [DefNew
Desired survivor size 5242880 bytes, new threshold 15 (max 15)
- age 1: 2237152 bytes, 2237152 total
: 54886K->2184K(92160K), 0.0508477 secs] 54886K->53384K(194560K), 0.0508847 secs] [Times: user=0.03 sys=0.03, real=0.06 secs]
[GC [DefNew
Desired survivor size 5242880 bytes, new threshold 15 (max 15)
- age 2: 2237008 bytes, 2237008 total
: 43144K->2184K(92160K), 0.0028660 secs] 94344K->53384K(194560K), 0.0028957 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
Heap
def new generation total 92160K, used 65263K [0x1a1d0000, 0x205d0000, 0x205d0000)
eden space 81920K, 77% used [0x1a1d0000, 0x1df69a10, 0x1f1d0000)
from space 10240K, 21% used [0x1f1d0000, 0x1f3f2250, 0x1fbd0000)
to space 10240K, 0% used [0x1fbd0000, 0x1fbd0000, 0x205d0000)
tenured generation total 102400K, used 51200K [0x205d0000, 0x269d0000, 0x269d0000)
the space 102400K, 50% used [0x205d0000, 0x237d0010, 0x237d0200, 0x269d0000)
compacting perm gen total 12288K, used 360K [0x269d0000, 0x275d0000, 0x2a9d0000)
the space 12288K, 2% used [0x269d0000, 0x26a2a3c0, 0x26a2a400, 0x275d0000)
ro space 8192K, 66% used [0x2a9d0000, 0x2af20f10, 0x2af21000, 0x2b1d0000)
rw space 12288K, 52% used [0x2b1d0000, 0x2b8206d0, 0x2b820800, 0x2bdd0000)
從中可以看到eden 大小為81920K, Survivor中from區域和to區域大小都是10240k。新生代總的92160K指的是eden和一個Survivor區域的和。
即原始的內存如圖:

為了演示年輕代對象晉級到年老代的過程。需要設置一個VM參數, 這裏設置MaxTenuringThreshold=1。前麵不設置的時候,默認MaxTenuringThreshold取值15。當設置不同的閾值,jvm在內存處理會有不同。我們重點觀察觀察alloc1 這麼小塊區域在不同的MaxTenuringThreshold參數設置下的遭遇。
這時候JVM的參數中加上MaxTenuringThreshold=1如下:
-verbose:gc -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=1 -XX:+PrintTenuringDistribution
可以看到輸出結果是:
[GC [DefNew
Desired survivor size 5242880 bytes, new threshold 1 (max 1)
- age 1: 2237152 bytes, 2237152 total
: 54886K->2184K(92160K), 0.0641037 secs] 54886K->53384K(194560K), 0.0641390 secs] [Times: user=0.03 sys=0.03, real=0.06 secs]
[GC [DefNew
Desired survivor size 5242880 bytes, new threshold 1 (max 1)
: 43144K->0K(92160K), 0.0036114 secs] 94344K->53384K(194560K), 0.0036418 secs] [Times: user=0.01 sys=0.00, real=0.01 secs]
Heap
def new generation total 92160K, used 63078K [0x1a1d0000, 0x205d0000, 0x205d0000)
eden space 81920K, 77% used [0x1a1d0000, 0x1df69a10, 0x1f1d0000)
from space 10240K, 0% used [0x1f1d0000, 0x1f1d0000, 0x1fbd0000)
to space 10240K, 0% used [0x1fbd0000, 0x1fbd0000, 0x205d0000)
tenured generation total 102400K, used 53384K [0x205d0000, 0x269d0000, 0x269d0000)
the space 102400K, 52% used [0x205d0000, 0x239f2260, 0x239f2400, 0x269d0000)
compacting perm gen total 12288K, used 360K [0x269d0000, 0x275d0000, 0x2a9d0000)
the space 12288K, 2% used [0x269d0000, 0x26a2a3c0, 0x26a2a400, 0x275d0000)
ro space 8192K, 66% used [0x2a9d0000, 0x2af20f10, 0x2af21000, 0x2b1d0000)
rw space 12288K, 52% used [0x2b1d0000, 0x2b8206d0, 0x2b820800, 0x2bdd0000)
四、過程解析
下麵觀察每一步語句執行後,jvm內存的變化情況,並給出解析。
1)在執行第一個語句,alloc1分配2M空間
1 |
alloc1 = new byte [tenMB / 5 ];
|
後,根據分代策略,在新生代的eden區分配2M的空間存儲對象。

2)在執行第二語句,alloc2分配50M
1 |
alloc2 = new byte [ 5 * tenMB];
|
前麵alloc1分配2M後,因為eden的80M空間還有80-2=78M還可以容納下allocation2要求的50M空間,因此接著在eden區域分配。

3)當執行第三句,alloc3分配40M
1 |
alloc3 = new byte [ 4 * tenMB];
|
還是嚐試在eden上分配,但是eden空間隻剩下28M,不能容納alloc3要求的40M空間。於是觸發在新生代上的一次gc,將Eden區的存活對象轉移到Survivor區。在這個裏先將2M的alloc1對象存放(其實是copy,參見java 垃圾回收策略的描述)到from區,然後copy 50M的alloc2對象,顯然survivor區不能容納下alloc2對象,該對象被直接copy到年老代。需要說明的是複製到Survivor區的對象在經曆一次gc後期對象年齡會被加一。

在eden區gc後騰出空間可以存放allocation3的40M對象,則alloc3分配40M對象如圖:

4)執行第四句,將alloc3置空
這是eden上alloc3分配的的40M對象則變成可被回收狀態。

5)執行第5句,對alloc重新分配60M空間
1 |
allocation3 = new byte [ 6 * tenMB];
|
還是嚐試先在eden區上分配,發現超出了eden區域的容量,則再次觸發新生代上的一次gc。首先eden上分配的40M對象因為沒有被再使用,則直接被回收。而根據的設置不同,這次gc的行為會稍有不同。
先看MaxTenuringThreshold不設置,即取默認值15的時候。eden區上無用的40M回收後,再考察Survivor區域的對象是否滿足對象晉升老年代的年齡閾值,發現from中的2M對象,年齡是1,不滿足晉升條件,則不被處理,隻是把Survivor區域的經曆這次回收未被處理的對象age加一,即新的age為2.如圖:

通過輸出日誌也顯示:經過這次回收年輕代大小,由43114K變為2184k,總的大小由94344k變為53384k,即反映出回收了40M無用對象。
Desired survivor size 5242880 bytes, new threshold 15 (max 15)
- age 2: 2237008 bytes, 2237008 total
: 43144K->2184K(92160K), 0.0028660 secs] 94344K->53384K(194560K), 0.0028957 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
在年輕代上gc後騰出空間後,新的alloc3的60M空間被分配到eden 區域上。分配後堆如下:

以上是不設置晉升閾值MaxTenuringThreshold情況下進行的gc,以及gc後alloc3的分配。
再看看當MaxTenuringThreshold設置為1的情況。同樣eden區上無用的40M回收後,再考察Survivor區域的對象是否滿足對象晉升老年代的年齡閾值,發現from中的2M對象,年齡是1,滿足晉升條件,則Survivor區域滿足年齡的對象被拷貝到年老區。

通過日誌顯示年輕代的大小被清0了,表示survivor的存活對象因為滿足晉升條件被移到被移到年老代了。
[GC [DefNew
Desired survivor size 5242880 bytes, new threshold 1 (max 1)
: 43144K->0K(92160K), 0.0036114 secs] 94344K->53384K(194560K), 0.0036418 secs] [Times: user=0.01 sys=0.00, real=0.01 secs]
同樣的,gc完後會在eden上分配空間來存儲alloc3對象,這種情況下堆結構如圖:

比較上麵兩個圖,發現差別就僅僅在於survivor中的2M對象是否被認為生存時間足夠長科院被移到年老代中去。從上麵日誌高亮部分from區域的最終存儲也可反映出了這個差別。
比較前麵兩個日誌可以看到:總的大小和上麵設置和不設置MaxTenuringThreshold(其實是MaxTenuringThreshold設置1還是15)沒有關係,都是由94344k變為53384k,即都是回收了40M eden區域無用對象。第N次gc時存活的滿足晉升條件則由survivor移到年老代,不滿足的還留在survivor區域,堆的總的大小沒有變。
五、最後
上麵通過最簡單的例子示意了下在jvm堆上對象是如果分配的,當空間不足時,是如何調整回收的。希望可以對jvm的堆上結構和gc思路有個基本的了解。當然相關參數(其實反映的是機製)遠比這個複雜,有挺多細節,更多的是在實踐中來體會。
最後更新:2017-05-22 20:03:26