JVM系列文章(二):垃圾回收机制

作为一个程序员,仅仅知道怎么用是远远不够的。起码,你需要知道为什么可以这么用,即我们所谓底层的东西。

那到底什么是底层呢?我觉得这不能一概而论。以我现在的知识水平而言:对于Web开发者,TCP/IP、HTTP等等协议可能就是底层;对于C、C++程序员,内存、指针等等可能就是底层的东西。那对于Java开发者,你的Java代码运行所在的JVM可能就是你所需要去了解、理解的东西。

我会在接下来的一段时间,和读者您一起去学习JVM,所有内容均参考自《深入理解Java虚拟机:JVM高级特性与最佳实践》(第二版),感谢作者。

本文是系列文章第二篇,讲述的是JVM的垃圾回收机制,即在虚拟机上,怎么判断哪些内存应该被回收、又是通过怎样的方式去回收的。

如果您对于Java内存区域还不太了解,建议您先阅读系列文章第一篇:JVM系列文章(一):Java内存区域分析

一、判断是否可以回收

Java内存区域中,程序计数器、虚拟机栈、本地方法栈3个区域随线程而生,随线程而灭;栈中的栈帧随着方法的进出而出栈入栈。每个栈帧中分配多少内存基本是在类结构确定时就已知的。因此这几个区域的内存分配和回收都具有确定性。因为方法结束或者线程结束时,内存自然就跟着回收了。而Java堆和方法区则不同,只有运行时才知道会创建哪些对象,垃圾收集器所关注的是这部分内存。

垃圾收集器在对堆进行回收前,首先当然是要确定哪些对象可以被回收,即已经“死了”,不可能再被使用到了。这个问题有两种算法:

1.引用计数算法

给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1。计数器值为0的对象就是不可能再被使用的。

这种算法实现简单,判定效率也高,但是它无法解决对象之间循环引用的问题。

2.可达性分析算法

这个算法的基本思路就是通过一系列的成为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径成为引用链,当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。

可作为GC Roots的对象包括下面几种:

虚拟机栈(栈帧中的本地变量表)中引用的对象

方法区中类静态属性引用的对象

方法去中常量引用的对象

本地方法栈中JNI(即一般所说的Native方法)引用的对象

这两种算法都与“引用”有关,那到底什么是引用?

如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。

这样的话,对象就只有被引用或者没有被引用两种状态,对于一些食之无味弃之可惜的对象显得无能为力。

我们希望能够描述这样一类对象:当内存空间足够时,能保留在内存中;如果内存空间在进行垃圾回收后还是非常紧张,就抛弃这些对象。很多系统的缓存功能都符合这样的场景。

JDK1.2之后Java的引用被分为强引用、软引用、弱引用、虚引用4种。这4种引用强度依次逐渐减弱。

强引用指类似"Object obj=new Object()"这类的引用,只要强引用还存在,垃圾回收器永远不会回收掉被引用的对象。

软引用用来描述一些还有用但并非必须的对象。在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围中进行第二次回收。用SoftReference类实现。

弱引用也描述非必需对象,只能存活到下一次垃圾回收之前。用WeakReference类实现。

虚引用也被称为幽灵引用,为一个对象设置虚引用的唯一目的就是能在这个对象被垃圾回收时收到一个系统通知。用PhantomReference类实现。

即便在可达性分析算法中不可达的对象,也并不是必须被回收的:如果这个对象不可达,就会被第一次标记并且进行筛选,筛选的条件是此对象是否有必要执行finailize()方法。如果对象没有覆盖finailize()方法或者这个方法已经被虚拟机调用过,就没有必要执行。如果有必要执行,这个对象会被放置在F-Queue队列之中,由一个虚拟机自动建立的、低优先级的Finalizer线程去执行它。如果finalize()方法中它重新与引用链关联,就摆脱了被回收的命运。(比如在finalize方法中写 XXX.xx=this)
需要注意的是,自救的机会只有一次,因为一个对象的finailize方法只会被系统自动调用一次。

回收方法区

主要是回收方法区的常量和类。

常量:比如没有一个String对象引用常量池的"abc",也没有其他地方引用,那"abc"就会被清理出常量池。

类:

判断类是否需要被回收要满足下列3个条件:

该类的所有实例已经被回收;

加载该类的ClassLoader已经被回收;

该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

二、垃圾收集算法

1.标记-清除算法

首先标记出所有需要回收的对象,在标记完成之后统一回收所有比标记的对象。

不足:第一是效率问题,标记和清除两个过程的效率都不高;另一个是空间问题,标记清除之后会产生大量不连续的内存碎片。

2.复制算法

把内存分为大小相等的两块,每次只用其中一块。当这一块的用完了,就把还存活的对象复制到另一块,然后再把已经用过的内存空间一次清理掉。

3.标记-整理算法

与标记清除类似,但是不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。

4.分代收集

根据对象存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都有大批对象死去,只有少量存活,那就使用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。老年代中存活率高,使用标记清理或者标记整理算法来回收。

三、安全点和安全区域

1.安全点

在需要GC时,只有到了安全点才能停止其他线程的工作。安全点不能太少以至于让GC等太久,又不能太多以至于过分增加运行时负担。一般只有方法调用、循环跳转、异常跳转等指令会产生安全点。

中断方式有两种:抢先式中断和主动式中断。

抢先式中断:在GC发生时首先把所有线程全部中断,如果发现有线程中断的地方不在安全点上就恢复线程让他跑到安全点上。(现在几乎不用)

主动式中断:在GC需要中断线程时,设置一个标志,各个线程执行时主动轮询,发现中断标志时就中断挂起。轮询标志的地方和安全点重合,另外再加上创建对象需要分配内存的地方。

2.安全区域

安全点可能遇到的问题: 线程处于Sleep或者Blocked状态,这时候线程无法响应JVM的中断请求,“走”到安全点去中断挂起,JVM也不太可能等到线程重新被分配CPU。

这种情况就需要安全区域来解决。

安全区域是指在一段代码片段中,引用关系不会发生变化。在这个区域的任何地方开始GC都是安全的。可以把它看做是拓展的安全点。线程执行到安全区域的代码时,标志自己进入了安全区域,当JVM发起GC时就不用管这些线程了。线程离开安全区域时,要检查是否完成了根节点枚举(或是整个GC过程),如果完成就继续执行,否则就等待。

四、各种垃圾收集器

1.Serial收集器

新生代收集器,复制算法,单线程,只会使用一个CPU或者一条收集线程去完成垃圾收集工作。在它进行收集时,必须暂停其他所有的工作线程,直到收集结束。

2.ParNew收集器

Serial的多线程版本,使用多条线程进行垃圾收集。

3.Parallel Scavenge收集器

新生代收集器,复制算法,多线程。它的关注点与其他收集器不同,其他的关注点是尽可能缩短垃圾收集时用户线程的停顿时间,而它的目标则是达到一个可控制的吞吐量(CPU运行代码的时间 /CPU总消耗时间)。停顿时间短不太表吞吐量大,因为可能是把新生代的内存总量缩小了。原来500M,10s收集一次,每次停顿100ms;现在300M,5s一次,每次70ms,停顿时间下降了,但是吞吐量也下降了。

4.Serial Old收集器

老年代,单线程,标记-整理算法。

5.Parallel Old收集器

Parallel Scavenge的老年代版本。使用多线程和标记-整理算法。

6.CMS收集器

Concurrent Mark Sweep收集器是一种以获取最短回收停顿时间为目标的收集器。一般应用在服务端。

整个收集过程分为4个步骤:

初始标记:标记GC Roots能直接关联到的对象

并发标记:进行GC Roots Tracing(形成链路)

重新标记:修改并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段停顿时间一般比初始标记长,但远比并发标记时间短

并发清除

整个过程中并发标记和并发清楚都可以和用户线程一起工作。

优点:并发收集、低停顿。

缺点:对CPU资源敏感(面向并发的程序都对CPU资源敏感)、无法处理浮动垃圾(在清理时又有新垃圾产生)

7.G1收集器

Garbage-First 收集器,面向服务端。

特点:

并行与并发、分代收集、空间整合、可预测的停顿

五、内存分配

1.对象优先在新生代的Eden区中分配

新生代还有两个Survivor区。当Eden区没有足够空间时,发起一次Minor GC。

新生代GC(Minor GC):指发生在新生代的垃圾收集动作,因为Java对象大多朝生夕灭,所以MInor GC非常频繁,速度也快。

老年代GC(Major/Full GC):指发生在老年代的GC。

2.大对象直接进入老年代

比如特别长的字符串(对于字符串占用内存不太清楚的话,可以参考http://www.jb51.net/article/59935.htm)、特别大的数组。

3.长期存活的对象进入老年代

虚拟机给每个对象定义了一个对象年龄计数器。如果对象在Eden出生并经过第一次MinorGC后仍然存活,并且能够被Survivor容纳的话,将被移动到Survivor空间中,对象年龄设为1。对象在Survivor中每熬过一次MinorGC,年龄就增加1,到达一定程度(默认15岁)就被晋升到老年代中。

4.动态对象年龄判定

如果在Survivor空间中相同年龄所有对象大小的总和大小大于Survivor空间的一般,年龄大于或等于该年龄的对象直接进入老年代。

时间: 2024-12-23 07:14:57

JVM系列文章(二):垃圾回收机制的相关文章

详解JVM内存管理与垃圾回收机制 (上)

Java应用程序是运行在JVM上的,得益于JVM的内存管理和垃圾收集机制,开发人员的效率得到了显著提升,也不容易出现内存溢出和泄漏问题.但正是因为开发人员把内存的控制权交给了JVM,一旦出现内存方面的问题,如果不了解JVM的工作原理,将很难排查错误.本文将从理论角度介绍虚拟机的内存管理和垃圾回收机制,算是入门级的文章,希望对大家的日常开发有所助益. 一.内存管理 也许大家都有过这样的经历,在启动时通过-Xmx或者-XX:MaxPermSize这样的参数来显式的设置应用的堆(Heap)和永久代(P

JVM系列之五:垃圾回收

. jdk1.7的堆内存 1. 堆(Java堆) 堆是java虚拟机所管理的内存中最大的一块内存区域,也是被各个线程共享的内存区域, 在JVM启动时创建,该内存区域存放了对象实例(包括基本类型的变量及其值)及数组(所有new的对象). 但是并不是所有的对象都在堆上,由于栈上分配和标量替换,导致有些对象不在堆上. 其大小通过-Xms(最小值)和-Xmx(最大值)参数设置, 1. -Xms为JVM启动时申请的最小内存,默认为操作系统物理内存的1/64但小于1G, 2. -Xmx为JVM可申请的最大内

JVM内存管理和垃圾回收机制介绍

http://backend.blog.163.com/blog/static/20229412620128233285220/ 内存管理和垃圾回收机制是JVM最核心的两个组成部分,对其内部实现的掌握是Java开发人员开发出高质量的Java系统的必备条件.最近整理了一些关于JVM内存管理和垃圾回收方面的知识,这里梳理一下,分享给大家,希望能够对Java虚拟机有更深入的了解. 1. JVM内存管理 首先,JVM将内存组织为主内存和工作内存两个部分.主内存中主要包括本地方法区和堆.每个线程都有一个工

JVM内存模型及垃圾回收机制

JVM内存模型1.栈Java栈是与每一个线程关联的,JVM在创建每一个线程的时候,会分配一定的栈空间给线程.存储局部变量.引用.方法.返回值等.StackOverflowError:如果在线程执行的过程中,栈空间不够用,那么JVM就会抛出此异常,这种情况一般是死递归造成的.2.堆 Java中堆是由所有的线程共享的一块内存区域,堆用来保存各种JAVA对象,比如数组,线程对象等. 2.1堆的分代JVM堆一般分为三个部分:Young:年轻代Young区被划分为三部分,Eden区和两个大小严格相同的Su

【java_基础】JVM内存模型和垃圾回收机制

1. JVM内存模型 Java虚拟机在程序执行过程会把jvm的内存分为若干个不同的数据区域来管理,这些区域有自己的用途,以及创建和销毁时间. 先来看一下Java程序具体执行的过程 上图中的运行数据区(Runtime Data Areas)即为JVM内存区域,其结构如下图: 各区域存储的具体信息: 1.1 程序计数器 程序计数器(Program Counter Register),也有称作为PC寄存器.JVM中的程序计数器跟汇编语言中的程序计数器在功能上是相同的,即指示待执行指令的地址.当 CPU

JVM调优(二)垃圾回收算法

原文出处: pengjiaheng 可以从不同的的角度去划分垃圾回收算法: 按照基本回收策略分 引用计数(Reference Counting): 比较古老的回收算法.原理是此对象有一个引用,即增加一个计数,删除一个引用则减少一个计数.垃圾回收时,只用收集计数为0的对象.此算法最致命的是无法处理循环引用的问题. 标记-清除(Mark-Sweep): 此算法执行分两阶段.第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,把未标记的对象清除.此算法需要暂停整个应用,同时,会产生内存碎

JVM内存概况与垃圾回收机制详解

参考:<Java虚拟机精讲> 一.JVM虚拟机内部的内存分布的概况 其中方法区我在博文java虚拟机类加载过程内存情况底层源码分析及ClassLoader讲解中详细讲解过,可参考那篇文章.它里面主要保存:运行时常量池.字段和方法数据.构造函数.普通方法的字节码等. PC寄存器会存储正在执行的字节码指令地址,线程私有 Java栈也为线程私有,生命周期与线程的生命周期一致 二.内存分配 1.分配步骤 当我们创建一个对象时,会经历如下步骤: 根据上面的描述得到下面的图 所以对象是分配在堆的Eden区

JVM系列文章(四):类加载机制

作为一个程序员,仅仅知道怎么用是远远不够的.起码,你需要知道为什么可以这么用,即我们所谓底层的东西. 那到底什么是底层呢?我觉得这不能一概而论.以我现在的知识水平而言:对于Web开发者,TCP/IP.HTTP等等协议可能就是底层:对于C.C++程序员,内存.指针等等可能就是底层的东西.那对于Java开发者,你的Java代码运行所在的JVM可能就是你所需要去了解.理解的东西. 我会在接下来的一段时间,和读者您一起去学习JVM,所有内容均参考自<深入理解Java虚拟机:JVM高级特性与最佳实践>(

JVM系列文章(三):Class文件内容解析

作为一个程序员,仅仅知道怎么用是远远不够的.起码,你需要知道为什么可以这么用,即我们所谓底层的东西. 那到底什么是底层呢?我觉得这不能一概而论.以我现在的知识水平而言:对于Web开发者,TCP/IP.HTTP等等协议可能就是底层:对于C.C++程序员,内存.指针等等可能就是底层的东西.那对于Java开发者,你的Java代码运行所在的JVM可能就是你所需要去了解.理解的东西. 我会在接下来的一段时间,和读者您一起去学习JVM,所有内容均参考自<深入理解Java虚拟机:JVM高级特性与最佳实践>(