《深入理解Java虚拟机》笔记 第三章 GC算法和GC器

?
?

【哪些内存需要回收】

?
?

当对象判定为"已死"状态,虚拟就要采取一定的手段将这些对象从内存中移除。

?
?

1.引用计数算法

?
?

很多教科书判断对象是否存活的算法是这样的:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值加1;当引用失效时,计数器减1;任何时刻计数器都为0的对象就是不可能再被使用的。

?
?

引用计数算法(Reference Counting)的实现简单,判断效率也很高,在大部分情况下它都是一个不错的算法。但是Java语言中没有选用引用计数算法来管理内存,其中最主要的一个原因是它很难解决对象之间相互循环引用的问题。

?
?

例如:在testGC()方法中,对象objA和objB都有字段instance,赋值令objA.instance=objB及objB.instance=objA,除此之外这两个对象再无任何引用,实际上这两个对象都已经不能再被访问,但是它们因为相互引用着对象方,异常它们的引用计数都不为0,于是引用计数算法无法通知GC收集器回收它们。

?
?

?
?

运行结果为:

?
?

[GC [DefNew: 234K->64K(960K), 0.0009447 secs][Tenured: 2125K->2189K(4096K), 0.0048757 secs] 2282K->2189K(5056K), [Perm : 365K->365K(12288K)], 0.0058659 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

[Full GC (System) [Tenured: 4237K->141K(6148K), 0.0052656 secs] 4237K->141K(7108K), [Perm : 365K->365K(12288K)], 0.0052973 secs] [Times: user=0.01 sys=0.00, real=0.01 secs]

?
?

在运行结果中可以看到GC日志中包含"4237K->141K",老年代从4273K(大约4M,其实就是objA与objB)变为了141K,意味着虚拟并没有因为这两个对象相互引用就不回收它们,这也证明虚拟并不是通过通过引用计数算法来判断对象是否存活的。

?
?

?
?

大家可以看到对象进入了老年代,但是大家都知道,对象刚创建的时候是分配在新生代中的,要进入老年代默认年龄要到了15才行,但这里objA与objB却进入了老年代。这是因为Java堆区会动态增长,刚开始时堆区较小,对象进入老年代还有一规则,当Survior空间中同一代的对象大小之和超过Survior空间的一半时,对象将直接进行老年代。

?
?

2.根搜算法

?
?

在主流的商用程序语言中(Java和C#),都是使用根搜索算法(GC Roots Tracing)判断对象是否存活的。

?
?

这个算法的基本思路就是通过一系列名为"GC Roots"的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的,如下图:

?
?

?
?

在Java语言里,可作为GC Roots对象的包括如下几种:

a.虚拟机栈(栈桢中的本地变量表)中的引用的对象

b.方法区中的类静态属性引用的对象

c.方法区中的常量引用的对象

d.本地方法栈中JNI的引用的对象

?
?

?
?

?
?

?
?

【如何回收】

?
?

主要由垃圾收集算法和垃圾收集器实现

?
?

【垃圾收集算法】

?
?

1.标记-清除算法

?
?

该算法是最基础的算法,分为"标记"和"清除"两个阶段

?
?

首先标记出所有需要回收的对象

?
?

在标记完成后统一回收掉所有被标记的对象。

?
?

之所有说它是最基础的算法是因为后续的收集算法都是基于这种思路并对其缺点进行改进得到的。

?
?

它的缺点主要有两个:一个是效率问题,标记和清除过程效率都不高;另外一个是空间问题,标记清除后会产生大量不连线内存碎片,内存碎片太多导致当程序运行进需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集操作。标记-清除算法的执行过程如下图:

?
?

2.复制算法

?
?

为了解决效率问题,"复制"收集算法出现了

?
?

它将可用内存按容量分为大小相等的两块

?
?

每只使用其中一块

?
?

当这一块内存使用完了,就将还存活着的对象复制到另外一块上

?
?

然后再把已使用过的内存空间一次性清理空

?
?

这样使得每次都是对其中一块进行内存回收

?
?

内存分配时也不用考虑内存碎片的问题

?
?

只需要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。

?
?

只是这种算法的代价是将内存缩小为原来的一半,代价太高了一点。复制算法执行过程如下图:

?
?

现在商业虚拟机都是采用这种算法来回收新生代

?
?

IBM的专门研究表明,新生代中的对象98%是朝生夕死的,生命周期很短

?
?

所以并不需要按照1:1的比例来划分内存空间,而是将内存分为一块较大的Eden空间与两块较小的Survivor空间

?
?

每次使用Eden与其中一块Survivor空间

?
?

当回收时,将Eden与Survivor中还存活的对象一次性地拷贝到另外一块Survivor空间中,最后清理掉Eden和刚才使用过的Survivor空间

?
?

HotSpot虚拟机默认Eden和Survivor空间比例为8:1,也就是每次新生代中可用内存为整个新生代容量的90%(80%+10%),只有10%的新生代内存是"浪费"的

?
?

当然,98%的对象可回收只是一般场景下的数据,但没有办法保证每回收都只有不多于10%对象存活,当Survivor空间不足时,需要依赖其它内存(老年代)进行分配担保。

?
?

3.标记-整理算法

?
?

复制算法在对象存活率较高时就要执行较多的复制操作,效率将会变低

?
?

如果不想浪费50%的空间,就需要有额外的空间进行担保,以应对被使用的内存中所有对象都100%存活的极端情况

?
?

所以在老年代一般不能直接选用这种算法

?
?

根据老年代的特点,"标记-整理"算法被提出,标记过程仍然与"标记-清除"算法一样,但后续步骤不是直接对可回收对象进行清除,而是让所有存活对象都向一端移动,然后直接清除掉端边界以外的内存。"标记-整理"算法执行示意图如下:

?
?

?
?

4.分代收集算法

?
?

当前商业虚拟机的垃圾收集都采用"分代收集"(Generational Collection)算法

?
?

该算法将根据对象存活周期不同将内存划分为几块

?
?

一般把Java堆分为新生代与老年代,这样就可以根据各个年代的特点采用最适当的收集算法。

?
?

在新生代中,每次垃圾收集都发现有大量对象死去,只有少量对象存活,就选得复制收集算法

?
?

只要付出少量存活对象的复制成本就可以完成收集

?
?

而老年代中因为对象存活率高、没有额外的空间对其进行分配担保,就必须使用"标记-清除"或"标记-整理"算法进行回收。

?
?

【垃圾收集器】

?
?

如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。

?
?

Java虚拟机规范中对象垃圾收集器应该如何实现并没有任何规定,因此不同的厂商,不同版本的虚拟机所提供的收集器可能会有很的差别,并且一般会提供参数供用户根据自己的应用特点和要求组合出各个年代所使用的收集器。

?
?

下面是Sun HotSpot虚拟机1.6版本Update22包含的所有收集器:

上图中,如果两个收集器之间存在连线,就说明它们可以搭配使用。

?
?

1.Serial收集器

???
?

Serial收集器是最基本、历史最悠久的收集器,曾经(在JDK1.3.1之前)是虚拟机新生代的唯一选择。

?
?

这是一个单线程的收集器,但它的"单线程"的意义并不仅仅说明它只会使用一个CPU或一条收集线程去完成垃圾工作,更重要的是它进行垃圾回收都,必须暂停其它所有工作线程(Sun将这件事情称之为"Stop The World"),直到它收集结束。下面是Serial/Serial Old收集器的运行过程:

?
?

到目前为止,Serial收集中是虚拟机运行在Client模式下的默认重新代收集器。它简单而高效(与其它收集器的单线程相比),对于限定单个CPU环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。在桌面应用场景中,分配给虚拟机的内存一般来说不会太大,收集几直兆甚至一两百兆的新生代,停顿时间完全可以控制在几十毫秒最多一百多毫秒内,只要不是频繁发生,这点停顿是可以接受的。所以,Serial收集器对于运行在Client模式下的虚拟机来说是一个很好的选择。

?
?

2.ParNew收集器

???
?

ParNew收集器是Serial收集器的多线程版本,除了使用多条线程进行垃圾收集之外,其余行为包含Serial收集器可用的所有控制参数(例如:-XX:SurvivorRatio、-XX:PretenureSizeThreshold、-XX:HandlePromotionFailure等)、收集算法、Stop The World、对象分配规则、回收策略等都与Serial收集器完全一样。ParNew收集器的工作过程如下图:

3.Parallel Scavenge收集器

???
?

Parallel Scavenge收集器也是一个新生代收集器,它也是使用复制收集算法。其特点是与其它收集器的关注点不同,CMS等收集嘎嘎关注点是尽可能缩短垃圾收集时用户线程的停顿时间,而Parallel Scavenge收集器的目的是达到一个可控制的吞吐量(Throughput)。所以吞量就是CPU用于运行用户代码的时候与CPU总消耗时间的比值,即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收回时间)。

???
?

停顿时间越短就越适合需要与用户交互的程序,良好的响应速度能提升用户的体验;而高吞吐量可以最高次第的利用CPU时间,尽快的完成程序任务,主要适合在后妈运算而不需要太多交互的任务。Parallel Scavenge收集器提供了两个参数用于精确控制吞吐量,分别是控制最大垃圾收集停顿时间的-XX:MaxGCPauseMillis及直接设置吞吐量大小的-XX:GCTimeRatio。Parallel Scavenge收集器还有一个参数-XX:UseAdaptiveSizePolicy,这是一个开关参数,当这个参数打开之后,就不需要手工指定新生代大小、Eden与Survivor区的比例,晋升老年代对象年龄等细节参数了。虚拟机会根据当前系统的运行情况收集性能监控信息,动态调用事这些参数以提供最合适的停顿时间或最大的吞吐量,这种调节方式称为GC自适应调用策略(GC Ergonomics)。

?
?

4.Serial Old收集器

???
?

Serial Old是Serial收集器的老年代版本,它同样是一个单线程收集器,使用"标记-整理"算法。

?
?

这个收集器的主要意义也是被client模式下的虚拟机使用。如果在server模式下,它主要有两大用途:一个是在JDK1.5及之前的版本中与Parallel Scavenge收集器搭配使用,另外一个就是作为CMS收集器的后备预案,在并发收集发生Concurrent Mode Failure的时候使用。Serial Old收集器的工作过程如下图:

5.Parallel Old收集器

???
?

Parallel Old是Parallel Scavenge收集器的老年代版本,使用多线程和"标记-整理"算法。这个收集器是在JDK1.6中才开始提供的,在此之前,新生代的Parallel Scavenge收集器一直处于比较尴尬的状态。原因是如果新生代选择了Parallel Scavenge收集器,老年代除了Serial Old(PS MarkSweep)收集器之外别无选择。

?
?

Parallel Old收集器的工作过程如下图:

6.CMS收集器

?
?

CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。目前很大一部分的Java应用都集中中互联网站或B/S系统的服务端上,这类应用尤其重视服务的响应速度,CMS收集器就非常符合这应用的需求。

?
?

CMS收集器是基于"标记-清除"算法实现的,它的运作过程相对前面几种收集器来说要复杂一点,整个过程分为4个步骤,包括:

a.初始标记(CMS initial mark)

b.并发标记(CMS concurrent mark)

c.重新标记(CMS remark)

d.并发清除(CMS concurrent sweep)

???
?

其中初始标记、重新标记这两个步骤仍然需要"Stop The World"。初始标记仅仅只是标记一下GC Roots能直接关联到的对象,速度很快,并发标记阶段就是进行GC Roots Tracing的过程,而重新标记阶段则是为了修正并发标记期间,因为用程序继续运行而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但远比并发标记的时间短。

???
?

由于整个过程上耗时最长的并发标记与并发清除过程中,收集器线程可以与用户线程一起工作,所以总体上说,CMS收集器的内存回收过程是与用户线程一起并发地执行的。执行图如下:

CMS是一款优秀的收集器,但它有三个显著缺点:

a.CMS收集器对CPU资源非常敏感。

b.CMS收集器无法处理浮动垃圾(Floating Garbage),可能出现"Concurrent Mode Failure"失败而导致另一次Full GC的产生。

c.CMS收集器采用"标记-清除"算法,这样会导致出现大量内存碎片。

?
?

7.G1收集器

???
?

G1收集器是垃圾收集器理论进一步发展的产物,它与前面的CMS收集器相比有两个显著改进:一是G1收集器是基于"标记-整理"算法实现,也就是说它不会产生内存碎片,这对于长时间运行的应用系统来说非常重要。二是它可以非常精确地控制停顿,即能让使用都明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不超过N毫秒,这几乎已经是实时Java(RTSJ)的垃圾收集器的特征了。

???
?

G1收集器可以实现在基本不牺牲吞量的前提下完成低停顿的内存回收,这是由于它能够极力地避免全区域的垃圾收集,之前的收集器进行收集的范围都是整个新生代或老年代,而G1将Java堆(包含新生代与老年代)划分为多个大小固定的独立区域,并且跟踪这些区域里的垃圾堆积程度,在后台维护一个优先列表,每次根据允许的收集时间,优先回收垃圾最多的区域(这就是Garbage First名称的由来)。区域划分及优先级的区域回收,保证了G1收集器在有限时间内可以获得最高的收集效率。

?
?

?
?

?
?

时间: 2024-10-10 16:17:46

《深入理解Java虚拟机》笔记 第三章 GC算法和GC器的相关文章

《深入理解JAVA虚拟机》----------第三章 垃圾收集器与内存分配策略,读后感(中)

1.垃圾收集器 1.1 Serial收集器 这个收集器是一个单线程的收集器,它在进行垃圾收集时,必须暂停其他所有的工作线程. 它是虚拟机运行在Client模式下的默认新生代收集器,它简单而高效. 1.2 ParNew收集器 其实就是Serial收集器的多线程版本,目前只有它能与CMS收集器配合工作. 原文地址:https://www.cnblogs.com/technologykai/p/10622586.html

深入理解java虚拟机笔记(一)-java内存区域与内存溢出

1. 前言 这是深入理解java虚拟机一书的笔记,来自第二章.因为这本书讲的比较深奥,这是第二次看,需要记录一下笔记. 2. 运行时数据区域 java虚拟机所管理的内存分为以下几个区域. ps:图片来自网络 2.1 程序计数器 程序计数器是一块较小的内存空间,他可以看做是当前线程所执行字节码的行号指示器.字节码解释器工作时就是通过改变这个计数器的值来选去下一条要执行的字节码指令,分之.循环.跳转.异常处理.线程恢复等基础功能都需要依赖这个计数器来完成. 这块内存是线程私有的内存. 如果线程在执行

【深入理解JAVA虚拟机】第三部分.虚拟机执行子系统.1.类文件结构

无关性 无关性的体现有两个方面: 1.平台无关性:可在不同的操作系统和机器指令集上执行,可在不同厂商的虚拟机平台上执行. 2.语言无关性:用不同编程语言写出的代码编译生成的文件都可以运行. 实现思想: 面向接口,定义虚拟机和编译器之间的接口规范.也就是编译后文件的存储格式——字节码(ByteCode). 任意一种编程语言,只要生成符合存储格式规范的Class文件,就可以被任意虚拟机执行. Class文件结构 Class文件结构是在<Java虚拟机规范>中定义的. Class文件的存储结构类似于

《深入理解Java虚拟机》-----第7章 虚拟机类加载机制——Java高级开发必须懂的

代码编译的结果从本地机器码转变为字节码,是存储格式发展的一小步,却是编程语言发展的一大步. 7.1 概述 上一章我们了解了Class文件存储格式的具体细节,在Class文件中描述的各种信息,最终都需要加载到虚拟机中之后才能运行和使用.而虚拟机如何加载这些Class文件?Class文件中的信息进入到虚拟机后会发生什么变化?这些都是本章将要讲解的内容. 虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验.转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载

深入理解Java虚拟机(第三版)-14. 线程安全与锁优化

14. 线程安全与锁优化 1. 什么是线程安全? 当多个线程同时访问一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替进行,也不需要进行额外的同步,或者在调用方进行任何其他的协调操作,调用这个对象的行为都可以获得正确的结果,那就称这个对象是线程安全的 2. Java语言中的线程安全 我们将Java语言下的线程安全分为以下五类:不可变.绝对线程安全.相对线程安全.线程兼容和线程对立. 1.不可变:不可变一定是线程安全的,无论是对象的方法实现还是方法的调用者,都不需要进行任何线程安全保障措施

Java学习笔记—第三章

第三章  标识符.关键字和数据类型 1. Java标识符和关键字:在程序设计中,通常用一个记号对变量.常量.方法和类等进行标识,这个记号称为标识符.Java语言本身使用了一些标识符,这些标识符称为Java关键字,用户在命名标识符时应该避免使用这些Java关键字,否则将导致程序无法进行编译. Java中的关键字如下: abstract 抽象 assert 断言 boolean 布尔 break 中断 byte 字节 catch 捕获 char 字符 class 类 continue 继续 defa

深入理解Java虚拟机笔记---属性表集合

在Class文件,字段表,方法表中都可以携带自己的属性表集合,以用于描述某些场景专有的信息.与Class文件中其它的数据项目要求的顺序.长度和内容不同,属性表集合的限制稍微宽松一些,不再要求各个属性表具有严格的顺序,并且只要不与已有的属性名重复,任何人实现的编译器都可以向属性表中写入自己定义的属性信息,Java虚拟机运行时会忽略掉它不认识的属性.为了能正确地解析Class文件,<Java虚拟机规范(第二版)>中预定义了9荐虚拟机实现应当能识别的属性,具体如下表所示: 对于每个属性,它的名称需要

深入理解Java虚拟机笔记---方法调用

方法调用并不等同于方法执行,方法调用阶段唯一的任务就是确定调用方法的版本(即调用哪一个方法),暂时还不涉及方法内部的具体运行过程.在程序运行时,进行方法调用是最普遍.最频繁的操作.在Class文件的编译过程中不包含传统编译中的连接步骤,一切方法调用在Class文件里存储的都只是符号引用,而不是方法在实际运行时内存布局中的入口地址(相当于直接引用).这个特性给Java带来了更强大的动态扩展能力,但也使得Java方法的调用过程变得相对复杂,需要在类加载期间甚至到运行期间才能确定目标方法的直接引用.

深入理解Java虚拟机笔记---垃圾收集器

如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现.Java虚拟机规范中对象垃圾收集器应该如何实现并没有任何规定,因此不同的厂商,不同版本的虚拟机所提供的收集器可能会有很的差别,并且一般会提供参数供用户根据自己的应用特点和要求组合出各个年代所使用的收集器.下面是Sun HotSpot虚拟机1.6版本Update22包含的所有收集器: 上图中,如果两个收集器之间存在连线,就说明它们可以搭配使用. 1.Serial收集器 Serial收集器是最基本.历史最悠久的收集器,曾经(在J