最近看了一些关于垃圾回收机制的文章,总结一下。
要回到java的垃圾回收机制,从以下三个方面去回答:
1、哪些内存会被收回?
2、什么时候收回?
3、如何收回?
首先,谈谈哪些对象会被收回。
通过根搜索算法(GC Roots Tracing)判断对象是否还活着。该算法通过一系列的名为“GC Roots”的对象做为起始点,通过这些节点向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链接(用图论来说就是从GC Roots到这个对象不可达),则说明该对象是不可用的,它们将会被判定为可回收的对象象。
其次,什么时候回收这些内存。
cpu空闲或者内存空间不足时,进行垃圾回收,而程序员本省无法控制何时进行垃圾回收。
最后,如何进行垃圾回收。
Java语言规范没有明确地说明JVM使用哪种垃圾回收算法, 大多数垃圾回收算法使用了根集(root set)这个概念;所谓根集就量正在执行的Java程序可以访问的引用 变量的集合(包括局部变量、参数、类变量),程序可以使用引用变量访问对象的属性和调用对象的方法。垃圾收集首选需要确定从根开始哪些是可达的和哪些是不可达 的,从根集可达的对象都是活动对象,它们不能作为垃圾被回收,这也包括从根集间接可达的对象。而根集通过任意路径不可达的对象符合垃圾收集的条件,应该被回收。大致有如下方法:
1、 引用计数法(Reference Counting Collector)
引用计数法是唯一没有使用根集的垃圾回收的法,该算法使用引用计数器来区分存活对象和不再使用的对象。一般来说,堆中的每个对象对应一个引用计数器。当每 一次创建一个对象并赋给一个变量时,引用计数器置为1。当对象被赋给任意变量时,引用计数器每次加1当对象出了作用域后(该对象丢弃不再使用),引用计数器减1,一旦引用计数器为0,对象就满足了垃圾收集的条件。
2、tracing算法(TracingCollector)
tracing算法是为了解决引用计数法的问题而提出,它使用了根集的概念。基于tracing算法的垃圾收集器从根集开始扫描,识别出哪些对象可达,哪些对象不可达,并用某种方式标记可达对象,例如对每个可达对象设置一个或多个位。在扫描识别过程中,基于tracing算法的垃圾收集也称为标记和清除(mark-and-sweep)垃圾收集器.
3、compacting算法(CompactingCollector)
为了解决堆碎片问题,基于tracing的垃圾回收吸收了Compacting算法的思想,在清除的过程中,算法将所有的对象移到堆的一端,堆的另一端就变成了一个相邻的空闲内存区,收集器会对它移动的所有对象的所有引用进行更新,使得这些引用在新的位置能识别原来的对象。
4、copying算法(CopingCollector)
该算法的提出是为了克服句柄的开销和解决堆碎片的垃圾回收。它开始时把堆分成一个对象 面和多个空闲面, 程序从对象面为对象分配空间,当对象满了,基于coping算法的垃圾 收集就从根集中扫描活动对象,并将每个活动对象复制到空闲面(使得活动对象所占的内存之间没有空闲洞),这样空闲面变成了对象面,原来的对象面 变成了空闲面,程序会在新的对象面中分配内存。
一种典型的基于coping算法的垃圾回收是stop-and-copy算法,它将堆分成对象面和空闲区域面,在对象面与空闲区域面的切换过程中,程序暂停执行。
5、generation算法(GenerationalCollector)
stop-and-copy垃圾收集器的一个缺陷是收集器必须复制所有的活动对象,这增加了程序等待时间,这是coping算法低效的原因。在程序设计中有这样的规律:多数对象 存在的时间比较短,少数的存在时间比较长。因此,generation算法将堆分成两个或多个,每个子堆作为对象的一代(generation)。由于多数对象存在的时间比较短,随着程序丢弃不使用的对象,垃圾收集器将从最年轻的子堆中收集这些对象。在分代式的垃圾收集器运行后,上次运行存活下来的对象移到下一最高代的子堆中,由于老一代的子堆不会经常被回收,因而节省了时间。
垃圾回收的算法很多,引用计数器算法、标记清除算法、复制算法、标记整理算法,随着发展,目前采用较多的是分代收集 算法。 其分为新生代和老年代,新生代中适合于频繁创建,并且高死亡率。老年代中适合于存活率高的。内存的分配方式见下图。
新生代和老年代的比例为1:2。大量的行创建的对象在被创建在Eden space上,但是代大的对象将直接被创建在老年中,避免大对象频繁的移动。大量新创建的对象将很快的死亡,也就是变成不可达对象,将Eden上的内存空间不够时,将进行minor gc 将Eden space和from space上的内存回收,使用复制算法,将活的即可达的对象复制到to space空间中,此时所有的对象‘年龄’+1,当达到一定的’年龄‘是会复制到老年代中,同时老年代也为新生代复制算法,有可能产生内存空间不足的问题提供了担保。这时候to sapce 下一步变成from space了,一直循环。老年代中,当内存空间不足时,执行full gc ,使用标记-整理算法。
版权声明:本文为博主原创文章,未经博主允许不得转载。