轉(zhuǎn)載自:http://blog.csdn.net/u010032648/article/details/50298663
CLR垃圾回收器根據(jù)所占空間大小劃分對(duì)象。大對(duì)象和小對(duì)象的處理方式有很大區(qū)別。比如內(nèi)存碎片整理 ------ 在內(nèi)存中移動(dòng)大對(duì)象的成本是昂貴的,讓我們研究一下垃圾回收器是如何處理大對(duì)象的,大對(duì)象對(duì)程序性能有哪些潛在的影響。
大對(duì)象堆和垃圾回收
在.Net 1.0和2.0中,如果一個(gè)對(duì)象的大小超過85000byte,就認(rèn)為這是一個(gè)大對(duì)象。這個(gè)數(shù)字是根據(jù)性能優(yōu)化的經(jīng)驗(yàn)得到的。當(dāng)一個(gè)對(duì)象申請(qǐng)內(nèi)存大小達(dá)到這個(gè)閥值,它就會(huì)被分配到大對(duì)象堆上。這意味著什么呢?要理解這個(gè),我們需要理解.Net垃圾回收機(jī)制。
如大多人所知道的,.Net GC是按照“代”來回收的。程序中的對(duì)象共有3代,0代、1代和2代,0代是最年輕的對(duì)象,2代對(duì)象存活的時(shí)間最長(zhǎng)。GC按代回收垃圾也是出于性能考慮的;通常的對(duì)象都會(huì)在0代是被回收。例如,在一個(gè)asp.net程序中,和每一個(gè)請(qǐng)求相關(guān)的對(duì)象都應(yīng)該在請(qǐng)求結(jié)束時(shí)回收掉。而沒有被回收的對(duì)象會(huì)成為1代對(duì)象;也就是說1代對(duì)象是常駐內(nèi)存對(duì)象和馬上消亡對(duì)象之間的一個(gè)緩沖區(qū)。
從代的角度看,大對(duì)象屬于2代對(duì)象,因?yàn)橹挥性?代回收時(shí)才會(huì)處理大對(duì)象。當(dāng)某代垃圾回收?qǐng)?zhí)行時(shí),會(huì)同時(shí)執(zhí)行更年輕代的垃圾回收。比如:當(dāng)1代垃圾回收時(shí)會(huì)同時(shí)回收1代和0代的對(duì)象,當(dāng)2代垃圾回收時(shí)會(huì)執(zhí)行1代和0代的回收.
代是垃圾回收器區(qū)分內(nèi)存區(qū)域的邏輯視圖。從物理存儲(chǔ)角度看,對(duì)象分配在不同的托管堆上。一個(gè)托管堆(managed heap)是垃圾回收器從操作系統(tǒng)申請(qǐng)的內(nèi)存區(qū)(通過調(diào)用windows api VirtualAlloc)。當(dāng)CLR載入內(nèi)存之后,會(huì)初始化兩個(gè)托管堆,一個(gè)大對(duì)象堆(LOH –large object heap)和一個(gè)小對(duì)象對(duì)(SOH – small object heap)。
內(nèi)存分配請(qǐng)求就是將托管對(duì)象放到對(duì)應(yīng)的托管堆上。如果對(duì)象的大小小于85000byte,它會(huì)被放置在SOH;否則會(huì)被放在LOH上。
對(duì)于SOH,對(duì)象在執(zhí)行一次垃圾回收之后,會(huì)進(jìn)入到下一代。也就是說如果在第一次執(zhí)行垃圾回收時(shí),存活下來的對(duì)象會(huì)進(jìn)入第二代,如果在第2次垃圾回收之后該對(duì)象仍然沒有被當(dāng)作垃圾回收掉,它就會(huì)成為2代對(duì)象;2代對(duì)象就是最老的對(duì)象不會(huì)在提升代數(shù)。
當(dāng)觸發(fā)垃圾回收時(shí),垃圾回收器會(huì)在小對(duì)象堆做碎片整理,將存活下來的對(duì)象移動(dòng)到一起。而對(duì)于大對(duì)象堆,由于移動(dòng)內(nèi)存的開銷很大,CLR團(tuán)隊(duì)選擇只是清除它們,將回收掉的對(duì)象組成一個(gè)列表,以便滿足下次有大對(duì)象申請(qǐng)使用內(nèi)存,相鄰的垃圾對(duì)象會(huì)被合并成一塊空閑的內(nèi)存塊。
需要時(shí)時(shí)留意的是,直到.Net 4.0中也不會(huì)對(duì)大對(duì)象堆做碎片整理操作,將來也許會(huì)做。因此如果你要分配大對(duì)象并不想他們被移動(dòng),你可以使用fixed語(yǔ)句。
如下小對(duì)象堆SOH的回收示意圖

上圖中第一次垃圾回收之前有四個(gè)對(duì)象obj0-3;在第一垃圾回收之后obj1和obj3被回收了,同市obj2和obj1移動(dòng)到一起了;在第二次垃圾回收之前有分配了三個(gè)對(duì)象obj4-6;在第二次執(zhí)行垃圾回收之后obj2和obj5被回收了,obj4和obj6被移動(dòng)到obj0旁邊。
下圖是大對(duì)象堆LOH回收示意圖
可以看到在未執(zhí)行垃圾回收之前,一共有四個(gè)對(duì)象obj0-3;第一次二代垃圾回收之后obj1和obj2被回收掉了,回收掉之后obj1和obj2所占空間被合并到了一起,在obj4申請(qǐng)分配內(nèi)存時(shí)就把obj1和obj2回收后釋放的空間分配給它了;同時(shí)留下了一塊內(nèi)存碎片。如果這個(gè)碎片的大小小于85000byte,那么這個(gè)碎片就在這個(gè)程序的生命周期中永遠(yuǎn)不能被再次利用了。
如果大對(duì)象堆上沒有足夠的空閑內(nèi)存容納要申請(qǐng)的大對(duì)象空間,CLR首先會(huì)嘗試向操作系統(tǒng)申請(qǐng)內(nèi)存,如果申請(qǐng)失敗,就會(huì)觸發(fā)一次二代回收來嘗試釋放一些內(nèi)存。
在2代垃圾回收時(shí),可以將不需要的內(nèi)存通過VirtualFree交還給操作系統(tǒng)。交還的過程參見下圖:

什么時(shí)候回收大對(duì)象呢?
在討論什么時(shí)候回收大對(duì)象之前先來看下普通的垃圾回收操作什么時(shí)機(jī)執(zhí)行吧。垃圾回收在下列情況下發(fā)生:
1. 申請(qǐng)的空間超過0代內(nèi)存大小或者大對(duì)象堆的閥值,多數(shù)的托管堆垃圾回收在這種情況下發(fā)生2. 在程序代碼中調(diào)用GC.Collect方法時(shí);如果在調(diào)用GC.Collect方法是傳入GC.MaxGeneration參數(shù)時(shí),會(huì)執(zhí)行所有代對(duì)象的垃圾回收,包括大對(duì)象堆的垃圾回收3. 操作系統(tǒng)內(nèi)存不足時(shí),當(dāng)應(yīng)用程序收到操作系統(tǒng)發(fā)出的高內(nèi)存通知時(shí)4. 如果垃圾回收算法認(rèn)為做二代回收是有收效時(shí)會(huì)觸發(fā)二代垃圾回收5. 每一代對(duì)象堆的都有一個(gè)所占空間大小閥值的屬性,當(dāng)你分配對(duì)象到某一代,你增長(zhǎng)了內(nèi)存總量接近了該代的閥值,或者分配對(duì)象導(dǎo)致這一代的堆大小超過了堆閥值,就會(huì)發(fā)生一次垃圾回收。因此當(dāng)你分配小對(duì)象或者大對(duì)象時(shí),會(huì)對(duì)應(yīng)消耗0代堆或者大對(duì)象堆的閥值。當(dāng)垃圾回收器將對(duì)象代數(shù)提升到1代或者2代時(shí),會(huì)消耗1、2代的閥值。在程序運(yùn)行中這些閥值是動(dòng)態(tài)變化的。
大對(duì)象堆性能影響
讓我們先看下分配大對(duì)象的代價(jià)。 CLR為每個(gè)新對(duì)象分配內(nèi)存時(shí)都要保證這些內(nèi)存清空的,是沒有被其他對(duì)象使用的(I give out is cleared)。這就意味著分配的代價(jià)完全被清理(clearing)的代價(jià)控制著(除非在分配時(shí)觸發(fā)了一次垃圾回收)。如果清空1byte需要2個(gè)周期(cycles),就意味著清除一個(gè)最小的大對(duì)象需要170,000個(gè)周期。通常情況下人們不會(huì)分配超大的對(duì)象,比如說在2GHz的機(jī)器上分配16M大小的對(duì)象,大約需要16ms來清空內(nèi)存。這代價(jià)太大了。
讓我們?cè)诳聪禄厥盏拇鷥r(jià)。前面提到過,大對(duì)象和2代齡對(duì)象一起回收。如果大對(duì)象或者2代對(duì)象占用空間超過其閥值時(shí),就會(huì)觸發(fā)2代對(duì)象的回收。如果2代回收因?yàn)榇髮?duì)象堆超過閥值被觸發(fā),2代對(duì)象堆本身沒有多少對(duì)象可以做回收。如果在2代堆上沒有多少對(duì)象,這問題不大。但是如果2代堆很大對(duì)象很多,過多的2代回收就會(huì)導(dǎo)致性能問題。如果是臨時(shí)性的分配大對(duì)象,就需要很多的時(shí)間來運(yùn)行垃圾回收;也就是說如果你持續(xù)的使用大對(duì)象然后又釋放大對(duì)象對(duì)性能會(huì)有很大的負(fù)面影響。
大對(duì)象堆上的巨大對(duì)象通常是數(shù)組(很少有一個(gè)對(duì)象很大的情況)。如果對(duì)象中的元素是強(qiáng)引用,代價(jià)會(huì)很高;如果元素之間沒有相互引用,垃圾回收時(shí)就不需要遍歷整個(gè)數(shù)組。例如:用一個(gè)數(shù)組來保存二叉樹的節(jié)點(diǎn),一種方法是在節(jié)點(diǎn)中強(qiáng)引用左右節(jié)點(diǎn):
class Node{ Data d; Node left; Node right;};Node[] binary_tr = new Node [num_nodes];如果num_nodes是一個(gè)很大的數(shù)字,就意味著每個(gè)節(jié)點(diǎn)都至少需要查看二個(gè)引用元素。一種替代方案是在節(jié)點(diǎn)中保存左右節(jié)點(diǎn)元素的數(shù)組索引號(hào)
class Node{ Data d; uint left_index; uint right_index;};這樣的話,元素之間的引用關(guān)系去掉了;可以通過binaryTree[left_index]來獲得引用的節(jié)點(diǎn)。垃圾回收器在做垃圾回收時(shí)也不需要看相關(guān)的引用元素了。
為大對(duì)象堆收集性能數(shù)據(jù)
有幾種方法可以收集大對(duì)象堆相關(guān)的性能數(shù)據(jù)。在我解釋這些方法之前,讓我們先談一下為什么需要收集大對(duì)象堆相關(guān)的性能數(shù)據(jù)。
在你開始上搜集某個(gè)方面的性能數(shù)據(jù)時(shí),有可能你已經(jīng)找到這方面造成性能瓶頸的證據(jù);或者你已經(jīng)沒有找遍了所有方面都沒有發(fā)現(xiàn)問題。
在查找性能問題時(shí).Net CLR Memory 性能計(jì)數(shù)器通常是應(yīng)該先考慮使用的工具。和LOH相關(guān)的計(jì)數(shù)器有g(shù)eneration 2 collectioins(2代堆收集次數(shù))和large object heap size大對(duì)象堆大小。Generation 2 collections顯示的是進(jìn)程啟動(dòng)之后2代垃圾回收操作發(fā)生的次數(shù)。Large object heap size計(jì)數(shù)器顯示的是當(dāng)前大對(duì)象堆的大小值,包括空閑空間;這個(gè)計(jì)數(shù)器是在每次垃圾回收操作之后做更新,并非每次分配內(nèi)存都做更新。
可以參考下圖在windows性能計(jì)數(shù)器中觀察.Net CLR Memory相關(guān)性能數(shù)據(jù)

你也可以通過程序查詢這些計(jì)數(shù)器的值;很多人通過程序的方式收集性能計(jì)數(shù)器來幫助查找性能瓶頸。
當(dāng)然也可以使用調(diào)試器winddbg觀察大對(duì)象堆。
最后提示一下:到目前為止,大對(duì)象堆作為垃圾回收的一部分是不做內(nèi)存碎片整理的,但是這個(gè)只是一個(gè)clr的實(shí)現(xiàn)細(xì)節(jié),程序代碼不應(yīng)該依賴這個(gè)特點(diǎn)。如果要確保對(duì)象不會(huì)被垃圾回收器移動(dòng),就要使用fixed語(yǔ)句。
新聞熱點(diǎn)
疑難解答
圖片精選
網(wǎng)友關(guān)注