一、JVM內(nèi)存的構(gòu)
java虛擬機(jī)會將內(nèi)存分為幾個不同的管理區(qū),這些區(qū)域各自有各自的用途,根據(jù)不同的特點,承擔(dān)不同的任務(wù)以及在垃圾回收時運(yùn)用不同的算法。總體分為下面幾個部分:
程序計數(shù)器(PRogram Counter Register)、JVM虛擬機(jī)棧(JVM Stacks)、本地方法棧(Native Method Stacks)、堆(Heap)、方法區(qū)(Method Area)
如下圖:

1、程序計數(shù)器(Program Counter Register)
這 是一塊比較小的內(nèi)存,不在Ram上,而是直接劃分在CPU上的,程序員無法直接操作它,它的作用是:JVM在解釋字節(jié)碼文件(.class)時,存儲當(dāng)前線程所執(zhí)行的字節(jié)碼的行號,只是一種概念模型,各種JVM所采用的方式不同,字節(jié)碼解釋器工作時,就是通過改變程序計數(shù)器的值來選取下一條要執(zhí)行的指令, 分支、循環(huán)、跳轉(zhuǎn)、等基礎(chǔ)功能都是依賴此技術(shù)區(qū)完成的。還有一種情況,就是我們常說的Java多線程方面的,多線程就是通過線程輪流切換而達(dá)到的,同一時刻,一個內(nèi)核只能執(zhí)行一個指令,所以,對于每一個程序來說,必須有一個計數(shù)器來記錄程序的執(zhí)行進(jìn)度,這樣,當(dāng)線程恢復(fù)執(zhí)行的時候,才能從正確的地方開始, 所以,每個線程都必須有一個獨立的程序計數(shù)器,這類計數(shù)器為線程私有的內(nèi)存。如果一個線程正在執(zhí)行一個Java方法,則計數(shù)器記錄的是字節(jié)碼的指令的地址,如果執(zhí)行的一個Native方法,則計數(shù)器的記錄為空,此內(nèi)存區(qū)是唯一一個在Java規(guī)范中沒有任何OutOfMemoryError情況的區(qū)域。
2、JVM虛擬機(jī)棧(JVM Stacks)
JVM虛擬機(jī)棧就是我們常說的堆棧的棧(我們常常把內(nèi)存粗略分為堆和棧),和程序計數(shù)器一樣,也是線程私有的,生命周期和線程一樣,每個方法被執(zhí)行的時候會產(chǎn)生一個棧幀, 用于存儲局部變量表、動態(tài)鏈接、操作數(shù)、方法出口等信息。方法的執(zhí)行過程就是棧幀在JVM中出棧和入棧的過程。局部變量表中存放的是各種基本數(shù)據(jù)類型,如 boolean、byte、char、等8種,及引用類型(存放的是指向各個對象的內(nèi)存地址),因此,它有一個特點:內(nèi)存空間可以在編譯期間就確定,運(yùn)行期不在改變。這個內(nèi)存區(qū)域會有兩種可能的Java異常:StackOverFlowError和OutOfMemoryError。
3、本地方法棧(Native Method Stacks)
從名字即可看出,本地方法棧就是用來處理Java中的本地方法的,Java類的祖先類Object中有眾多Native方法,如hashCode()、 wait()等,他們的執(zhí)行很多時候是借助于操作系統(tǒng),但是JVM需要對他們做一些規(guī)范,來處理他們的執(zhí)行過程。此區(qū)域,可以有不同的實現(xiàn)方法,像我們常用的Sun的JVM就是本地方法棧和JVM虛擬機(jī)棧是同一個。
4、堆(Heap)
堆內(nèi)存是內(nèi)存中最重要的一塊,也是最有必要進(jìn)行深究的一部分。因為Java性能的優(yōu)化,主要就是針對這部分內(nèi)存的。所有的對象實例及數(shù)組都是在堆上面分配的(隨著JIT技術(shù)的逐漸成熟,這句話似乎有些絕對,不過至少目前還基本是這樣的),可通過-Xmx和-Xms來控制堆的大小。JIT 技術(shù)的發(fā)展產(chǎn)生了新的技術(shù),如棧上分配和標(biāo)量替換,也許在不久的幾年里,即時編譯會誕生及成熟,那個時候,“所有的對象實例及數(shù)組都是在堆上面分配的”這句話就應(yīng)該稍微改改了。堆內(nèi)存是垃圾回收的主要區(qū)域,所以在下文垃圾回收板塊會重點介紹,此處只做概念方面的解釋。在32位系統(tǒng)上最大為2G,64位系統(tǒng)上無限制。可通過-Xms和-Xmx控制,-Xms為JVM啟動時申請的最小Heap內(nèi)存,-Xmx為JVM可申請的最大Heap內(nèi)存。
5、方法區(qū)(Method Area)
方法區(qū)是所有線程共享的內(nèi)存區(qū)域,用于存儲已經(jīng)被JVM加載的類信息、常量、靜態(tài)變量等數(shù)據(jù),一般來說,方法區(qū)屬于持久代(關(guān)于持久代,會在GC部分詳細(xì)介紹,除了持久代,還有新生代和舊生代),也難怪Java規(guī)范將方法區(qū)描述為堆的一個邏輯部分,但是它不是堆。方法區(qū)的垃圾回收比較棘手,就算是Sun的 HotSpot VM在這方面也沒有做得多么完美。此處引入方法區(qū)中一個重要的概念:運(yùn)行時常量池。主要用于存放在編譯過程中產(chǎn)生的字面量(字面量簡單理解就是常量)和引用。一般情況,常量的內(nèi)存分配在編譯期間就能確定,但不一定全是,有一些可能就是運(yùn)行時也可將常量放入常量池中,如String類中有個Native方法 intern()。
此處補(bǔ)充一個在JVM內(nèi)存管理之外的一個內(nèi)存區(qū):直接內(nèi)存。在JDK1.4中新加入類NIO類,引入了一種基于通道與緩沖區(qū)的I/O方式,它可以使用Native函數(shù)庫直接分配堆外內(nèi)存,即我們所說的直接內(nèi)存,這樣在某些場景中會提高程序的性能。
二、垃圾回收
有句話說的好:Java和C++之間有一堵有內(nèi)存分配和垃圾回收技術(shù)圍成的墻,墻外的人想進(jìn)去,墻里的人想出去!這句話的意思,請讀者自己去琢磨。總的來說,C、C++程序員有時苦于內(nèi)存泄露,內(nèi)存管理是件令人頭痛的事兒,但是Java程序員呢,又羨慕C++程序員,自己可以控制一切,這樣就不會在內(nèi)存管理方面顯得束手無策,的確如此,作為Java程序員我們很難去控制JVM的內(nèi)存回收,只能根據(jù)它的原理去適應(yīng),盡量提高程序的性能。下面開始講解Java垃圾回收,即Garbage Collection,GC。從以下四個方面進(jìn)行:
1、為什么要進(jìn)行垃圾回收?
隨著程序的運(yùn)行,內(nèi)存中存在的實例對象、變量等信息占據(jù)的內(nèi)存越來越多,如果不及時進(jìn)行垃圾回收,必然會帶來程序性能的下降,甚至?xí)驗榭捎脙?nèi)存不足造成一些不必要的系統(tǒng)異常。
2、哪些“垃圾”需要回收?
在我們上面介紹的五大區(qū)中,有三個是不需要進(jìn)行垃圾回收的:程序計數(shù)器、JVM棧、本地方法棧。因為它們的生命周期是和線程同步的,隨著線程的銷毀,它們占用的內(nèi)存會自動釋放,所以只有方法區(qū)和堆需要進(jìn)行GC。具體到哪些對象的話,簡單概況一句話:如果某個對象已經(jīng)不存在任何引用,那么它可以被回收。通俗解釋一下就是說,如果一個對象,已經(jīng)沒有什么作用了,就可以被當(dāng)廢棄物被回收了。
3、什么時候進(jìn)行垃圾回收?
根據(jù)一個經(jīng)典的引用計數(shù)算法,每個對象添加一個引用計數(shù)器,每被引用一次,計數(shù)器加1,失去引用,計數(shù)器減1,當(dāng)計數(shù)器在一段時間內(nèi)保持為0時,該對象就認(rèn)為是可以被回收得了。但是,這個算法有明顯的缺陷:當(dāng)兩個對象相互引用,但是二者已經(jīng)沒有作用時,按照常規(guī),應(yīng)該對其進(jìn)行垃圾回收,但是其相互引用,又不符合垃圾回收的條件,因此無法完美處理這塊內(nèi)存清理,因此Sun的JVM并沒有采用引用計數(shù)算法來進(jìn)行垃圾回收。而是采用一個叫:根搜索算法,如下圖:

基本思想就是:從一個叫GC Roots的對象開始,向下搜索,如果一個對象不能到達(dá)GC Roots對象的時候,說明它已經(jīng)不再被引用, 即可被進(jìn)行垃圾回收(此處暫且這樣理解,其實事實還有一些不同,當(dāng)一個對象不再被引用時,并沒有完全“死亡”,如果類重寫了finalize()方法,且沒有被系統(tǒng)調(diào)用過,那么系統(tǒng)會調(diào)用一次finalize()方法,以完成最后的工作,在這期間,如果可以將對象重新與任何一個和GC Roots有引用的對象相關(guān)聯(lián),則該對象可以“重生”,如果不可以,那么就說明徹底可以被回收了),如上圖中的Object5、Object6、 Object7,雖然它們3個依然可能相互引用,但是總體來說,它們已經(jīng)沒有作用了,這樣就解決了引用計數(shù)算法無法解決的問題。
補(bǔ)充引用的概念:JDK 1.2之后,對引用進(jìn)行了擴(kuò)充,引入了強(qiáng)、軟、若、虛四種引用,被標(biāo)記為這四種引用的對象,在GC時分別有不同的意義:
a> 強(qiáng)引用(Strong Reference).就是為剛被new出來的對象所加的引用,它的特點就是,永遠(yuǎn)不會被回收。
b> 軟引用(Soft Reference).聲明為軟引用的類,是可被回收的對象,如果JVM內(nèi)存并不緊張,這類對象可以不被回收,如果內(nèi)存緊張,則會被回收。此處有一個問題,既然被引用為軟引用的對象可以回收,為什么不去回收呢?其實我們知道,Java中是存在緩存機(jī)制的,就拿字面量緩存來說,有些時候,緩存的對象就是當(dāng)前可有可無的,只是留在內(nèi)存中如果還有需要,則不需要重新分配內(nèi)存即可使用,因此,這些對象即可被引用為軟引用,方便使用,提高程序性能。
c> 弱引用(Weak Reference).弱引用的對象就是一定需要進(jìn)行垃圾回收的,不管內(nèi)存是否緊張,當(dāng)進(jìn)行GC時,標(biāo)記為弱引用的對象一定會被清理回收。
d> 虛引用(Phantom Reference).虛引用弱的可以忽略不計,JVM完全不會在乎虛引用,其唯一作用就是做一些跟蹤記錄,輔助finalize函數(shù)的使用。
最后總結(jié),什么樣的類需要回收呢?無用的類,何為無用的類?需滿足如下要求:
1> 該類的所有實例對象都已經(jīng)被回收。
2> 加載該類的ClassLoader已經(jīng)被回收。
3> 該類對應(yīng)的反射類java.lang.Class對象沒有被任何地方引用。
4、如何進(jìn)行垃圾回收?
本塊內(nèi)容以介紹垃圾回收算法為主,因為我們前面有介紹,內(nèi)存主要被分為三塊,新生代、舊生代、持久代。三代的特點不同,造就了他們所用的GC算法不同,新生代適合那些生命周期較短,頻繁創(chuàng)建及銷毀的對象,舊生代適合生命周期相對較長的對象,持久代在Sun HotSpot中就是指方法區(qū)(有些JVM中根本就沒有持久代這中說法)。首先介紹下新生代、舊生代、持久代的概念及特點:

新生代:New Generation或者Young Generation。上面大致分為Eden區(qū)和Survivor區(qū),Survivor區(qū)又分為大小相同的兩部分:FromSpace 和ToSpace。新建的對象都是用新生代分配內(nèi)存,Eden空間不足的時候,會把存活的對象轉(zhuǎn)移到Survivor中,新生代的大小可以由-Xmn來控制,也可以用-XX:SurvivorRatio來控制Eden和Survivor的比例.舊生代:Old Generation。用于存放新生代中經(jīng)過多次垃圾回收仍然存活的對象,例如緩存對象。舊生代占用大小為-Xmx值減去-Xmn對應(yīng)的值。
持久代:Permanent Generation。在Sun的JVM中就是方法區(qū)的意思,盡管有些JVM大多沒有這一代。主要存放常量及類的一些信息默認(rèn)最小值為16MB,最大值為64MB,可通過-XX:PermSize及-XX:MaxPermSize來設(shè)置最小值和最大值。
常見的GC算法:
標(biāo)記-清除算法(Mark-Sweep)
最基礎(chǔ)的GC算法,將需要進(jìn)行回收的對象做標(biāo)記,之后掃描,有標(biāo)記的進(jìn)行回收,這樣就產(chǎn)生兩個步驟:標(biāo)記和清除。這個算法效率不高,而且在清理完成后會產(chǎn)生內(nèi)存碎片,這樣,如果有大對象需要連續(xù)的內(nèi)存空間時,還需要進(jìn)行碎片整理,所以,此算法需要改進(jìn)。
復(fù)制算法(Copying)
前面我們談過,新生代內(nèi)存分為了三份,Eden區(qū)和2塊Survivor區(qū),一般Sun的JVM會將Eden區(qū)和Survivor區(qū)的比例調(diào)為8:1,保證有一塊Survivor區(qū)是空閑的,這樣,在垃圾回收的時候,將不需要進(jìn)行回收的對象放在空閑的Survivor區(qū),然后將Eden區(qū)和第一塊Survivor區(qū)進(jìn)行完全清理,這樣有一個問題,就是如果第二塊Survivor區(qū)的空間不夠大怎么辦?這個時候,就需要當(dāng)Survivor區(qū)不夠用的時候,暫時借持久代的內(nèi)存用一下。此算法適用于新生代。
標(biāo)記-整理(或叫壓縮)算法(Mark-Compact)
和標(biāo)記-清除算法前半段一樣,只是在標(biāo)記了不需要進(jìn)行回收的對象后,將標(biāo)記過的對象移動到一起,使得內(nèi)存連續(xù),這樣,只要將標(biāo)記邊界以外的內(nèi)存清理就行了。此算法適用于持久代。
常見的垃圾收集器:
根據(jù)上面說的諸多算法,每天JVM都有不同的實現(xiàn),我們先來看看常見的一些垃圾收集器:

首先介紹三種實際的垃圾回收器:串行GC(SerialGC)、并行回收GC(Parallel Scavenge)和并行GC(ParNew)。
1、Serial GC。是最基本、最古老的收集器,但是現(xiàn)在依然被廣泛使用,是一種單線程垃圾回收機(jī)制,而且不僅如此,它最大的特點就是在進(jìn)行垃圾回收的時候,需要將所有正在執(zhí)行的線程暫停(Stop The World),對于有些應(yīng)用這是難以接受的,但是我們可以這樣想,只要我們能夠做到將它所停頓的時間控制在N個毫秒范圍內(nèi),大多數(shù)應(yīng)用我們還是可以接受的,而且事實是它并沒有讓我們失望,幾十毫米的停頓我們作為客戶機(jī)(Client)是完全可以接受的,該收集器適用于單CPU、新生代空間較小及對暫停時間要求不是非常高的應(yīng)用上,是client級別默認(rèn)的GC方式,可以通過-XX:+UseSerialGC來強(qiáng)制指定。
2、ParNew GC。基本和Serial GC一樣,但本質(zhì)區(qū)別是加入了多線程機(jī)制,提高了效率,這樣它就可以被用在服務(wù)器端(Server)上,同時它可以與CMS GC配合,所以,更加有理由將它置于Server端。
3、Parallel Scavenge GC。在整個掃描和復(fù)制過程采用多線程的方式來進(jìn)行,適用于多CPU、對暫停時間要求較短的應(yīng)用上,是server級別默認(rèn)采用的GC方式,可用-XX:+UseParallelGC來強(qiáng)制指定,用-XX:ParallelGCThreads=4來指定線程數(shù)。以下給出幾組使用組合:

4、CMS (Concurrent Mark Sweep)收集器。該收集器目標(biāo)就是解決Serial GC 的停頓問題,以達(dá)到最短回收時間。常見的B/S架構(gòu)的應(yīng)用就適合用這種收集器,因為其高并發(fā)、高響應(yīng)的特點。CMS收集器是基于“標(biāo)記-清除”算法實現(xiàn)的,整個收集過程大致分為4個步驟:
初始標(biāo)記(CMS initial mark)、并發(fā)標(biāo)記(CMS concurrent mark)、重新標(biāo)記(CMS remark)、并發(fā)清除(CMS concurrent sweep)。
其中初始標(biāo)記、重新標(biāo)記這兩個步驟任然需要停頓其他用戶線程。初始標(biāo)記僅僅只是標(biāo)記出GC ROOTS能直接關(guān)聯(lián)到的對象,速度很快,并發(fā)標(biāo)記階段是進(jìn)行GC ROOTS 根搜索算法階段,會判定對象是否存活。而重新標(biāo)記階段則是為了修正并發(fā)標(biāo)記期間,因用戶程序繼續(xù)運(yùn)行而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分對象的標(biāo)記記錄,這個階段的停頓時間會被初始標(biāo)記階段稍長,但比并發(fā)標(biāo)記階段要短。由于整個過程中耗時最長的并發(fā)標(biāo)記和并發(fā)清除過程中,收集器線程都可以與用戶線程一起工作,所以整體來說,CMS收集器的內(nèi)存回收過程是與用戶線程一起并發(fā)執(zhí)行的。
CMS收集器的優(yōu)點:并發(fā)收集、低停頓,但是CMS還遠(yuǎn)遠(yuǎn)達(dá)不到完美。
CMS收集器主要有三個顯著缺點:
a>.CMS收集器對CPU資源非常敏感。在并發(fā)階段,雖然不會導(dǎo)致用戶線程停頓,但是會占用CPU資源而導(dǎo)致引用程序變慢,總吞吐量下降。CMS默認(rèn)啟動的回收線程數(shù)是:(CPU數(shù)量+3) / 4。
b>.CMS收集器無法處理浮動垃圾,可能出現(xiàn)“Concurrent Mode Failure“,失敗后而導(dǎo)致另一次Full GC的產(chǎn)生。由于CMS并發(fā)清理階段用戶線程還在運(yùn)行,伴隨程序的運(yùn)行自熱會有新的垃圾不斷產(chǎn)生,這一部分垃圾出現(xiàn)在標(biāo)記過程之后,CMS無法在本次收集中處理它們,只好留待下一次GC時將其清理掉。這一部分垃圾稱為“浮動垃圾”。也是由于在垃圾收集階段用戶線程還需要運(yùn)行,即需要預(yù)留足夠的內(nèi)存空間給用戶線程使用,因此CMS收集器不能像其他收集器那樣等到老年代幾乎完全被填滿了再進(jìn)行收集,需要預(yù)留一部分內(nèi)存空間提供并發(fā)收集時的程序運(yùn)作使用。在默認(rèn)設(shè)置下,CMS收集器在老年代使用了68%的空間時就會被激活,也可以通過參數(shù)-XX:CMSInitiatingOccupancyFraction的值來提供觸發(fā)百分比,以降低內(nèi)存回收次數(shù)提高性能。要是CMS運(yùn)行期間預(yù)留的內(nèi)存無法滿足程序其他線程需要,就會出現(xiàn)“Concurrent Mode Failure”失敗,這時候虛擬機(jī)將啟動后備預(yù)案:臨時啟用Serial Old收集器來重新進(jìn)行老年代的垃圾收集,這樣停頓時間就很長了。所以說參數(shù)-XX:CMSInitiatingOccupancyFraction設(shè)置的過高將會很容易導(dǎo)致“Concurrent Mode Failure”失敗,性能反而降低。
c>.最后一個缺點,CMS是基于“標(biāo)記-清除”算法實現(xiàn)的收集器,使用“標(biāo)記-清除”算法收集后,會產(chǎn)生大量碎片。空間碎片太多時,將會給對象分配帶來很多麻煩,比如說大對象,內(nèi)存空間找不到連續(xù)的空間來分配不得不提前觸發(fā)一次Full GC。為了解決這個問題,CMS收集器提供了一個-XX:UseCMSCompactAtFullCollection開關(guān)參數(shù),用于在Full GC之后增加一個碎片整理過程,還可通過-XX:CMSFullGCBeforeCompaction參數(shù)設(shè)置執(zhí)行多少次不壓縮的Full GC之后,跟著來一次碎片整理過程。
5、G1收集器。相比CMS收集器有不少改進(jìn),首先基于標(biāo)記-整理算法,不會產(chǎn)生內(nèi)存碎片問題,其次,可以比較精確的控制停頓,此處不再詳細(xì)介紹。
6、Serial Old。Serial Old是Serial收集器的老年代版本,它同樣使用一個單線程執(zhí)行收集,使用“標(biāo)記-整理”算法。主要使用在Client模式下的虛擬機(jī)。
7、Parallel Old。Parallel Old是Parallel Scavenge收集器的老年代版本,使用多線程和“標(biāo)記-整理”算法。
8、RTSJ垃圾收集器,用于Java實時編程,后續(xù)會補(bǔ)充介紹。
三、Java程序性能優(yōu)化
gc()的調(diào)用
調(diào)用gc方法暗示著Java 虛擬機(jī)做了一些努力來回收未用對象,以便能夠快速地重用這些對象當(dāng)前占用的內(nèi)存。當(dāng)控制權(quán)從方法調(diào)用中返回時,虛擬機(jī)已經(jīng)盡最大努力從所有丟棄的對象中回收了空間,調(diào)用System.gc() 等效于調(diào)用Runtime.getRuntime().gc()。
finalize()的調(diào)用及重寫
gc只能清除在堆上分配的內(nèi)存(純java語言的所有對象都在堆上使用new分配內(nèi)存),而不能清除棧上分配的內(nèi)存(當(dāng)使用JNI技術(shù)時,可能會在棧上分配內(nèi)存,例如java調(diào)用c程序,而該c程序使用malloc分配內(nèi)存時)。因此,如果某些對象被分配了棧上的內(nèi)存區(qū)域,那gc就管不著了,對棧上的對象進(jìn)行內(nèi)存回收就要靠finalize()。舉個例子來說,當(dāng)java 調(diào)用非java方法時(這種方法可能是c或是c++的),在非java代碼內(nèi)部也許調(diào)用了c的malloc()函數(shù)來分配內(nèi)存,而且除非調(diào)用那個了 free() 否則不會釋放內(nèi)存(因為free()是c的函數(shù)),這個時候要進(jìn)行釋放內(nèi)存的工作,gc是不起作用的,因而需要在finalize()內(nèi)部的一個固有方法調(diào)用free()。
優(yōu)秀的編程習(xí)慣
(1)避免在循環(huán)體中創(chuàng)建對象,即使該對象占用內(nèi)存空間不大。(2)盡量及時使對象符合垃圾回收標(biāo)準(zhǔn)。(3)不要采用過深的繼承層次。(4)訪問本地變量優(yōu)于訪問類中的變量。
四、常見問題
1、內(nèi)存溢出
就是你要求分配的java虛擬機(jī)內(nèi)存超出了系統(tǒng)能給你的,系統(tǒng)不能滿足需求,于是產(chǎn)生溢出。2、內(nèi)存泄漏
是指你向系統(tǒng)申請分配內(nèi)存進(jìn)行使用(new),可是使用完了以后卻不歸還(delete),結(jié)果你申請到的那塊內(nèi)存你自己也不能再訪問,該塊已分配出來的內(nèi)存也無法再使用,隨著服務(wù)器內(nèi)存的不斷消耗,而無法使用的內(nèi)存越來越多,系統(tǒng)也不能再次將它分配給需要的程序,產(chǎn)生泄露。一直下去,程序也逐漸無內(nèi)存使用,就會溢出。
文章出處:http://blog.csdn.net/zhangerqing
新聞熱點
疑難解答