https://www.jianshu.com/p/43c1b262d36b
1. 标记 – 清除算法
最基础的收集算法是”标记 – 清除”算法,之所以说它是最基础的是因为它逻辑简单、使用简便,而且后续的收集算法大多基于这种算法的不足而优化的。
标记 – 清除算法分为两个阶段:
- 标记阶段:标记的过程就是前面的可达性分析法执行的过程。首先遍历所有 GC Roots 对象,对从 GC Roots 对象可达的对象都打上一个可达标识。这个可达标识一般记录在对象 header 中(一个对象一般包括对象头、实例数据、对齐填充三个部分),表示该对象可以被 GC Roots 访问。
- 清除阶段:清除阶段是对堆内存进行遍历,通过读取这些对象的 header 信息来获取对象是否标记可达。如果未标记则表示这些对象没有引用,就可以进行回收。
标记 – 清除算法主要不足有两个:
- 效率问题:标记和清除都需要遍历,效率不高;
- 空间问题:标记清除后会产生大量不连续的内存水平,空间碎片太多会导致大内存对象无法生成而频繁进行 GC。
2. 复制算法
为了解决效率问题,复制算法出现了。
- 原理:将可用内存按容量大小分为大小相等的两块,每次只使用其中一块。当这一块内存使用完毕,就将存活的对象复制到另一块上,然后再把这一块所有的对象一次性清理掉。
-
当一块内存使用完毕以后,将其中的可达对象复制到另一块,然后再一次性清除原理的内存空间。
- 优点:简答高效,内存相对整齐
- 缺点:
1.将内存分为一半,代价略高。
2.如果对象存活率高,需要复制的对象比较多,产生效率问题。 - 优化:
在新生代中,由于大量的对象都是”朝生夕死”,也就是说一次垃圾收集后存活对象较少,因此我们可以把内存划分为三块:Eden、Survior1、Survior2,大小比例为 8:1:1。分配内存时只使用 Eden + Survior1,当这里的内存将满时,JVM 会出发一次 MinorGC,清除掉废弃对象,并将存活对象复制到另一块 Survior2 中。那么接下来就使用 Eden + Survior2 进行内存分配。
通过这种方式只需浪费 10% 的内存空间即可实现复制清除算法,同时避免了内存碎片的问题。
3. 标记 – 整理算法
- 原理:标记过程与 “标记 – 清除” 算法相同,但后续不是直接对可回收对象进行清理,而是让所有存活对象都向一端移动,然后直接清理掉一端边界外的内存。
- 优点:无需复制,保证效率。内存规整。
- 缺点:效率不如复制算法。
三种算法排行
在了解了以上三种 GC 算法以后,作一个简单的排行:
效率:复制算法 > 标记 – 整理算法 > 标记 – 清除 算法(标记 – 清除会产生内存碎片,需要大内存时会出发新一轮 GC)。
内存规整率:复制算法 = 标记 – 整理 > 标记 – 清除。
内存利用率:标记 – 整理算法 = 标记 – 清除算法 > 复制算法。
4. 分代收集算法
当前商业虚拟机的垃圾收集都采用 “分代收集” 算法,这种相当于结合以上几种算法进行结合。
- 原理:把 Java 堆分为新生代和老年代,根据各个对象的年代采用最合适的收集算法。
针对新生代的对象,采取灵活比例的复制算法,只需要复制少量存活对象就可以完成收集。
针对老年代的对象,因为这些对象存活率高,没有额外空间进行分配担保,必须使用 标记 – 清除 或 标记 – 整理 算法。