https://www.jianshu.com/p/43c1b262d36b

1. 标记 – 清除算法

最基础的收集算法是”标记 – 清除”算法,之所以说它是最基础的是因为它逻辑简单、使用简便,而且后续的收集算法大多基于这种算法的不足而优化的。

标记 – 清除算法分为两个阶段:

  1. 标记阶段:标记的过程就是前面的可达性分析法执行的过程。首先遍历所有 GC Roots 对象,对从 GC Roots 对象可达的对象都打上一个可达标识。这个可达标识一般记录在对象 header 中(一个对象一般包括对象头、实例数据、对齐填充三个部分),表示该对象可以被 GC Roots 访问。
  2. 清除阶段:清除阶段是对堆内存进行遍历,通过读取这些对象的 header 信息来获取对象是否标记可达。如果未标记则表示这些对象没有引用,就可以进行回收。

标记 – 清除算法主要不足有两个:

  • 效率问题:标记和清除都需要遍历,效率不高;
  • 空间问题:标记清除后会产生大量不连续的内存水平,空间碎片太多会导致大内存对象无法生成而频繁进行 GC。

 

2. 复制算法

为了解决效率问题,复制算法出现了。

  • 原理:将可用内存按容量大小分为大小相等的两块,每次只使用其中一块。当这一块内存使用完毕,就将存活的对象复制到另一块上,然后再把这一块所有的对象一次性清理掉。
  • 当一块内存使用完毕以后,将其中的可达对象复制到另一块,然后再一次性清除原理的内存空间。

    • 优点:简答高效,内存相对整齐
    • 缺点:
      1.将内存分为一半,代价略高。
      2.如果对象存活率高,需要复制的对象比较多,产生效率问题。
    • 优化:
      在新生代中,由于大量的对象都是”朝生夕死”,也就是说一次垃圾收集后存活对象较少,因此我们可以把内存划分为三块:Eden、Survior1、Survior2,大小比例为 8:1:1。分配内存时只使用 Eden + Survior1,当这里的内存将满时,JVM 会出发一次 MinorGC,清除掉废弃对象,并将存活对象复制到另一块 Survior2 中。那么接下来就使用 Eden + Survior2 进行内存分配。
      通过这种方式只需浪费 10% 的内存空间即可实现复制清除算法,同时避免了内存碎片的问题。

     

3. 标记 – 整理算法
  • 原理:标记过程与 “标记 – 清除” 算法相同,但后续不是直接对可回收对象进行清理,而是让所有存活对象都向一端移动,然后直接清理掉一端边界外的内存。
  • 优点:无需复制,保证效率。内存规整。
  • 缺点:效率不如复制算法。

三种算法排行

在了解了以上三种 GC 算法以后,作一个简单的排行:

效率:复制算法 > 标记 – 整理算法 > 标记 – 清除 算法(标记 – 清除会产生内存碎片,需要大内存时会出发新一轮 GC)。

内存规整率:复制算法 = 标记 – 整理 > 标记 – 清除。

内存利用率:标记 – 整理算法 = 标记 – 清除算法 > 复制算法。

 

4. 分代收集算法

当前商业虚拟机的垃圾收集都采用 “分代收集” 算法,这种相当于结合以上几种算法进行结合。

  • 原理:把 Java 堆分为新生代和老年代,根据各个对象的年代采用最合适的收集算法。
    针对新生代的对象,采取灵活比例的复制算法,只需要复制少量存活对象就可以完成收集。
    针对老年代的对象,因为这些对象存活率高,没有额外空间进行分配担保,必须使用 标记 – 清除 或 标记 – 整理 算法。