①对于java虚拟机来说,垃圾收集器主要关注的内存区域是 堆和方法区。
②垃圾收集器就是要收集那些已经“死了”的对象。如果判断一个对象是否存活?
- 对象引用计数法
对象引用增加一个,那么相应的计数器加1,否则,减1。
优点:实现简单
缺点:不能处理对象间的循环引用。a引用b,b同时引用a.
- 可达性分析
如果节点到root节点可达,则证明是存活的;否则,已死。所以对于下图的o5,o6,o7虽然他们是循环引用的,但是到root节点无可达,所以已死可清除。
③垃圾回收器对于不同类型引用的回收规则
- 强引用
像A a = new A()这种的属于强引用。只要存在这种引用,GC就不会回收。
- 软引用
用来描述一些还有用但不是非必需的对象。对于软引用关联的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收没有足够的内存,才会抛出内存溢出异常。在JDK1.2之后,提供了SoftReference类来实现软引用。
- 弱引用
非必需对象。弱引用对象只能活到下一次GC之前,不管内存是否异常,都会回收这部分对象。WeakReference类来实现弱引用。
- 虚引用
虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。对象无法通过虚引用来取得一个对象实例。为一个对象设置虚引用的唯一目的就是在这个对象被收集器回收时收到一个系统通知。PhantomReference类来实现虚引用。
④GC算法
- 标记-清除算法(mark-sweep)
先标记(要存活的对象)后清除。
优点:简单
缺点:1、标记和清除效率都不高2、清除完死亡对象以后内存存在不连续的碎片,如果需要存放大对象时很可能因为找不到合适的空空间而在此GC。
- 复制算法
把内存区域平均分成两块,当其中一块内部不足需要GC时,把该块中存活的对象复制到另一块中并紧凑排好,然后把该块对象整体清除。
新生代中存活对象少,垃圾收集频率高,很适合使用复制算法。又新生代中每次可回收对象在98%左右(不是确定的),所以新生代中内存分成了eden:survivor1:survivor2 = 8:1:1。每次使用eden区和其中的一块survivor。当GC时,一次性把eden和其中一块survivor中存活的对象复制到另外一块survivor。当survivor空间不够时,需要使用老年代进行空间分配担保。
优点:compact,速度快
缺点:可供使用的内存变少了,可能导致GC次数增加。
- 标记-整理(compact)算法
先标记(和标记-清除相同操作),然后让存活的对象都向一端移动,然后直接清除掉段边界以外的内存。
优点:剩余空间比较连续,不会存在标记-清除算法那种总空间够用但是因为空间不连续导致的GC
缺点:速度比较慢,因为要把存活对象移动
总结:针对新生代和老年代的不同特点,选择的GC算法不同。
新生代特点是“朝生夕死”,每次存活的对象比较少,适合复制算法。
老年代特点是存活对象久,存活对象多,复制算法不适合(复制代价大,担保代价大),一般选用标记-清除或者标记-整理算法。
⑤垃圾收集器分类和特点
没有一个普适的垃圾收集器。垃圾收集器就是GC算法的具体实现。
GC针对新生代和老年代特点,分别有对应不同的垃圾收集器。
新生代的有:Serial(串行),ParNew(parallel new ...),parallel scavenger
老年代的有:CMS(concurrent mark sweep),Serial Old, parallel old
新老均可的:G1
新生代和老年代是可以搭配使用的,搭配的图示如下,其中,如果二者之间有联系,证明他俩可以搭配使用。
- Serial(串行)
- 新生代收集器,单线程,在执行垃圾收集工作时需要停止其他所有线程(stop-the-world)
- 适合运行在client模式
- ParNew
- 新生代收集器,与Serial的区别是它是并行的
- parallel scavenge
- 新生代收集器,主要关注吞吐量(吞吐量=T(程序运行时间)/ (T(程序运行时间)+T(垃圾收集时间)))。适合在和客户端交互不强的服务器端使用。
- 它不能与CMS搭配使用,一般与老年代的 parallel old 搭配使用
- CMS (concurrent mark sweep)
- 老年代收集器,并发标记清扫。主要关注停顿时间,在于客户端强交互的场景下适用。
- Serial Old
- 老年代收集器。对应于新生代Serial 的老年代版本,串行
- parallel old
- 老年代收集器。它的出现主要是解决关注吞吐量的新生代的 parallel scavenge。因为在它没有出现之前,如果新生代使用了parallel scavenge收集器,那么老年代只能使用 Serial Old。而他俩搭配的效率几乎还不如ParNew + CMS
- G1
- 新生代和老年代收集器。不产生碎片,适用于长时间运行
垃圾收集器 | 收集线程 | 收集算法 | 适用场景 | 备注 |
Serial | 单线程 | 复制算法 | 新生代收集器,Client模式下的虚拟机 | 简单而高效的优点 |
ParNew | 多线程 | 复制算法 | 新生代收集器,Server模式下的虚拟机 | 可与CMS配合工作 |
Parallel Scavenge | 多线程 | 复制算法 | 新生代收集器,适合在后台运算而交互少的任务 | 关注吞吐量,采用GC自适应调节策略 |
Serial Old | 单线程 | 标记-整理算法 | 老年代收集器,Client模式下的虚拟机 | Server模式下与其他收集器配合使用 |
Parallel Old | 多线程 | 标记-整理算法 | 老年代收集器 | 实现“吞吐量优先”收集器应用组合 |
CMS | 多线程 | 标记-清除算法 | 互联网站或者B/S系统的服务端 | 并发收集、低停顿,CPU资源敏感 |
G1 | 多线程 | 标记-整理算法 | 面向服务端 | 不会产生碎片,有利于长时间运行,可预测的停顿 |
⑥GC日志各字段的含义
下面是书上的一段:
具体各个值的含义如下:
- 33.125和100.667:表示从jvm启动到目前所经历的时间
- GC和Full GC:这个不是用来区分是年轻代GC还是老年代GC,而是是否发生了 stop-the-world。DefNew和Tenured:表示GC发生的区域。具体和使用的垃圾收集器有关。例如:DefNew(Default New Generation)表示Serial新生代收集器。ParNew(Parallel New Generation)表示ParNew新生代收集器。如果是 Parallel Scavenge 收集器,则对应名称为“PSYoungGen”.老年代的名称为Tenured。方法区(永久代)则为Perm.
- 3324K->152K(3712K):表示该区域GC前已用大小->GC后已用大小(总内存大小)
- 0.0025925 secs:表示GC所使用的时间
- 3324K->152K(11904K):表示jvm内存GC前已用大小->GC后已用大小(JVM《总内存大小)
- 0.0031680 secs:表示GC所使用的时间
⑦内存分配策略
- 对象优先在新生代的Eden区分配
如果Eden区没有足够的空间来分配新的内存,则进行一次minor GC。新生代采用复制算法,所以需要把Eden存活对象复制到survivor区。如果Eden区存活对象占用内存大于survivor区大小,则通过空间分配担保直接存入老年代。否则,存入新生代的survivor区。
- 大对象直接进入老年代
- 长期存活的对象进入老年代
- 对象动态分配...