欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java虚拟机四:垃圾回收算法与垃圾收集器

程序员文章站 2022-06-22 12:55:09
在Java运行时的几个数据区域中,程序计数器,虚拟机栈,本地方法栈3个区域随着线程而生,随线程而灭,因此这几个区域的内存分配和回收具有确定性,不需要过多考虑垃圾回收问题,因为方法结束或者线程结束时,内存就回收了。但是方法区和堆区不一样,一个接口或者实现类所需要的内存可能不一样,一个方法的多个分支需要 ......

  在java运行时的几个数据区域中,程序计数器,虚拟机栈,本地方法栈3个区域随着线程而生,随线程而灭,因此这几个区域的内存分配和回收具有确定性,不需要过多考虑垃圾回收问题,因为方法结束或者线程结束时,内存就回收了。但是方法区和堆区不一样,一个接口或者实现类所需要的内存可能不一样,一个方法的多个分支需要的内存也可能不一样,只有程序运行时才能知道创建哪些对象,这部分内存的分配和回收是动态的。

  在进行垃圾回收时候,首先需要判断哪些对象需要回收,这就涉及到回收算法的问题。

一、垃圾回收算法

1.标记-清除算法

  标记-清除算法是一种最基础的垃圾收集算法,分为“标记”和“清除”两步。“标记”阶段标记所有需要进行垃圾回收的对象,标记完成后统一回收被标记的对象。这种算法的不足点在于:

  (1)效率问题,标记和清除两个过程效率都不高;

  (2)空间问题,标记清除后会产生大量不连续碎片,后续如果需要为较大对象分配空间,则又需触发垃圾回收。

2.复制算法

  为了解决标记-清除算法的效率问题,出现了复制算法。这种算法把内存按照容量划分为大小相同的两块,每次只是用其中一块,当这块内存用完了,就把还存活的对象复制到另外一块中,并将这块的内存清理掉,然后使用另外一块,当另外一块内存用完了,再把存活的对象复制到这块中,并清理另外一块内存,依次类推。

  复制算法主要用于新生代的回收,在hotspot虚拟机中,新生代内存划分为一块较大的eden空间,和两块较小的survivor空间,每次使用eden空间和其中一块survivor空间。当进行垃圾回收时,会把eden空间和survivor空间中存活的对象一次性复制到另外一块survivor空间上,最后清理掉eden空间和刚才使用过的survivor空间。hotspot虚拟机中,默认情况下eden空间和survivor空间的大小比例是8:1,即eden空间占整个新生代的80%,每次新生代中使用的空间为80%+10%=90%,闲置空间10%。

3.标记-整理算法

  复制算法适用于那种对象存活率较低的场景,在对象存活率较高时,使用复制收集算法意味着需要进行大量复制,会使效率降低,同时复制大量存活对象到另外一块内存,意味着需要有足够大的内存来保存这些对象,这势必会降低内存使用率。根据老年代的特点,有人提出标记-整理算法,和标记-清除算法不同的是,标记整理算法将存活的对象向一端移动,然后直接清理掉端边界之外的内存。

4.分代收集算法

  目前商业虚拟机中都使用分代收集算法。一般将java堆分为新生代和老年代,新生代进行垃圾收集发现有大量对象死去,只有少量对象存活,那么就使用复制算法。老年代中对象存活率较高,使用标记-清除算法或者标记-整理算法。

二、垃圾收集器

   垃圾收集算法提供了内存回收的方法论,垃圾收集器是内存回收的方法论。每个厂商对垃圾收集器的实现不一样,这里主要讨论jdk1.7 update 14之后的hotspot虚拟机。这个虚拟机中包含的垃圾收集器有如下7种:

                                     Java虚拟机四:垃圾回收算法与垃圾收集器

    以上收集器之间如果有连线,则表明可以搭配使用,虚拟机所处区域,表示他是新生代收集器还是老年代收集器。

1.serial收集器

  serial收集器是一种最基本的单线程收集器,这种收集器工作时,必须停止其他所有工作线程,优点在于简单高效,但体验很不友好,目前主要应用场合是:虚拟机运行在client模式下的默认新生代收集。器。

2.parnew收集器

  parnew收集器是serial收集器的多线程版本,常用参数设置:

   -xx:+useconcmarksweepgc :设置parnew为默认的新生代收集器;

   -xx:+useparnewgc :指定使用parnew为年轻代收集器,强制指定;

   -xx:parallelgcthreads=n :设置收集器的线程数为n。

3.parallel scavenge收集器

  parallel scavenge收集器是一个使用复制算法的新生代收集器,这种收集器的主要目标是达到一个可控制的吞吐量(throughput,cpu用于运行用户代码的时间与cpu总消耗时间的比值,即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间))。由于与吞吐量关系密切,故而parallel scavenge收集器也称为“吞吐量优先”收集器。常用参数设置:

   -xx:maxgcpausemillis=n :设置年轻代垃圾收集的最长时间;

   -xx:gctimeratio=n :设置垃圾收集总可用时长的比例,和吞吐量直接相关;

   -xx:+useadaptivesizepolicy 自适应大小开关,配置该选项之后,每次gc后会重新计算 eden、from 和 to 区的大小,计算依据是 gc 过程中统计的 gc 时间、吞吐量、内存占用量,因此设置此参数之后就不需要再设置 -xx:survivorratio 、 -xx:pretenuresizethreshold 等参数了。

4.serial old收集器

  serial收集器的老年版本,也是一个单线程收集器,使用的是“标记-整理”算法,这种收集器的主要意义也是给client模式下的虚拟机使用。

5.parallel old收集器

  parallel old收集器是parallel scavenge收集器的老年代版本,使用多线程和“标记-整理”算法。在注重吞吐量以及cpu资源敏感的场合,都可以优先考虑parallel scavenge收集器和parallel old收集器的组合。

6.cms收集器

  cms收集器是一种以获取最短回收停顿时间为目标的收集器。它基于“标记-清除”算法实现,运作过程相对于其他几种收集器更复杂一些。分为以下四个过程:

  (1)初始标记(cms initial mark):标记一下cg roots能关联到的对象;

  (2)并发标记(cms concurrent mark):进行cg roots tracing的过程;

  (3)重新标记(cms remark):修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录。

  (4)并发清理(cms concurrent sweep)

  cms 收集器的优点在于并发收集,低停顿。其缺点在于以下三点:

  (1)cms收集器对cpu很敏感,cms默认回收线程是(cpu数量+3)/4,当cpu在4个以上时,并发收集时垃圾收集线程不少于25%的cpu资源,并随着cpu数量增加而下降。但是当cpu不足4个时,cms对用户程序的影响就会变得很大。

  (2)cms收集器无法处理浮动垃圾。由于cms收集器并发清理阶段用户线程还在运行着,伴随着程序运行就会有垃圾产生,这部分垃圾在标记过后,cms收集器无法在当次收集中清理这些垃圾。

  (3)由于cms收集器是一种基于“标记-清除”算法的收集器,这种算法实现的收集器在收集结束后会有大量不连续碎片产生。碎片过多时会给大对象分配带来很大麻烦,往往老年代还有很大空间剩余,但是无法找到连续空间分配当前对象,因而不得不提前触发full gc。

7.g1收集器

  g1收集器是一款面向服务端应用的垃圾收集器,与其他收集器相比,g1收集器具有如下优点:

  (1)并发与并行:g1能充分利用多cpu,多核硬件优势,使用多个cpu来减少停顿时间;

  (2)分代收集:g1不需要其他收集器配合就能独立管理整个堆的垃圾收集,且它能采用不同方式去处理新建对象和已经存活了一段时间,熬过多次gc的旧对象以获得更好的收集效果。

  (3)空间整合:使用g1收集器不会产生内存碎片,收集后能提供规整的可用内存。这种特性有利于程序长时间运行,分配大对象时候不会因为无法找到连续内存空间而提前触发下一次gc.

  (4)可预测的停顿:g1除了追求低停顿,还能建立可预测的停顿时间模型,能让使用着指定在长度为m毫秒的时间片段内,消耗在垃圾收集上的时间不超过n毫秒。

 

三、垃圾收集参数总结

参数 描述
useserialgc

虚拟机运行在client模式下的默认值,打开此开关后,使用serial+serial old的收集器组合进行内存回收

useparnewgc 打开此开关后,使用parnew + serial old 的收集器组合进行内存回收
useconcmarksweepgc 打开此开关后,使用parnew + cms + serial old 的收集器组合进行内存回收。serial old 收集器将作为cms收集器出现concurrent mode failure失败后的后备收集器使用
useparallelgc 虚拟机运行在server 模式下的默认值,打开此开关后,使用parallel scavenge + serial old(ps marksweep)的收集器组合进行内存回收
useparalleloldgc 打开此开关后,使用parallel scavenge + parallel old 的收集器组合进行内存回收
survivorratio 新生代中eden 区域与survivor 区域的容量比值,默认为8,代表eden :survivor=8∶1
pretenuresizethreshold 直接晋升到老年代的对象大小,设置这个参数后,大于这个参数的对象将直接在老年代分配
maxtenuringthreshold 晋升到老年代的对象年龄。每个对象在坚持过一次minor gc 之后,年龄就加1,当超过这个参数值时就进入老年代
useadaptivesizepolicy 动态调整java 堆中各个区域的大小以及进入老年代的年龄
handlepromotionfailure 是否允许分配担保失败,即老年代的剩余空间不足以应付新生代的整个eden 和survivor 区的所有对象都存活的极端情况
parallelgcthreads 设置并行gc 时进行内存回收的线程数
gctimeratio gc 时间占总时间的比率,默认值为99,即允许1% 的gc 时间。仅在使用parallel scavenge 收集器时生效
maxgcpausemillis 设置gc 的最大停顿时间。仅在使用parallel scavenge 收集器时生效
cmsinitiatingoccupancyfraction 设置cms 收集器在老年代空间被使用多少后触发垃圾收集。默认值为68%,仅在使用cms 收集器时生效
usecmscompactatfullcollection 设置cms 收集器在完成垃圾收集后是否要进行一次内存碎片整理。仅在使用cms 收集器时生效
cmsfullgcsbeforecompaction 设置cms 收集器在进行若干次垃圾收集后再启动一次内存碎片整理,仅在使用cms 收集器时生效

 

 

参考资料:《深入理解java虚拟机 jvm高级特性与最佳实践 第2版》