搞懂Go垃圾回收

本文主要介绍了垃圾回收的概念,Golang GC的垃圾回收算法和工作原理,看完本文可以让你对Golang垃圾回收机制有个全面的理解。由于本人不了解其他语言的GC,并未对比其他语言的垃圾回收算法,需要的可以自行Google。

什么是垃圾回收

垃圾回收(英语:Garbage Collection,缩写为GC),在计算机科学中是一种自动的存储器管理机制。当一个计算机上的动态存储器不再需要时,就应该予以释放,以让出存储器,这种存储器资源管理,称为垃圾回收。垃圾回收器可以让程序员减轻许多负担,也减少程序员犯错的机会。来自维基百科

简单地说,垃圾回收(GC)是在后台运行一个守护线程,它的作用是在监控各个对象的状态,识别并且丢弃不再使用的对象来释放和重用资源。

go的垃圾回收

当前Golang使用的垃圾回收机制是三色标记发配合写屏障辅助GC,三色标记法是标记-清除法的一种增强版本。

标记-清除法(mark and sweep)

原始的标记清楚法分为两个步骤:

  1. 标记。先STP(Stop The World),暂停整个程序的全部运行线程,将被引用的对象打上标记
  2. 清除没有被打标机的对象,即回收内存资源,然后恢复运行线程。

这样做有个很大的问题就是要通过STW保证GC期间标记对象的状态不能变化,整个程序都要暂停掉,在外部看来程序就会卡顿。

三色标记法

三色标记法是对标记阶段的改进,原理如下:

  1. 初始状态所有对象都是白色。
  2. 从root根出发扫描所有根对象(下图a,b),将他们引用的对象标记为灰色(图中A,B)

    那么什么是root呢?
    看了很多文章都没解释这这个概念,在这儿说明下:root区域主要是程序运行到当前时刻的栈和全局数据区域。

  1. 分析灰色对象是否引用了其他对象。如果没有引用其它对象则将该灰色对象标记为黑色(上图中A);如果有引用则将它变为黑色的同时将它引用的对象也变为灰色(上图中B引用了D)
  2. 重复步骤3,直到灰色对象队列为空。此时白色对象即为垃圾,进行回收。

也可以参考下面的动图辅助理解:

Go GC如何工作

上面介绍的是GO GC采用的三色标记算法,但是好像并没有体现出来怎么减少STW对程序的影响呢?其实是因为Golang GC的大部分处理是和用户代码并行的

GC期间用户代码可能会改变某些对象的状态,如何实现GC和用户代码并行呢?先看下GC工作的完整流程:

  1. Mark: 包含两部分:
  • Mark Prepare: 初始化GC任务,包括开启写屏障(write barrier)和辅助GC(mutator assist),统计root对象的任务数量等。这个过程需要STW
  • GC Drains: 扫描所有root对象,包括全局指针和goroutine(G)栈上的指针(扫描对应G栈时需停止该G),将其加入标记队列(灰色队列),并循环处理灰色队列的对象,直到灰色队列为空。该过程后台并行执行
  1. Mark Termination: 完成标记工作,重新扫描(re-scan)全局指针和栈。因为Mark和用户程序是并行的,所以在Mark过程中可能会有新的对象分配和指针赋值,这个时候就需要通过写屏障(write barrier)记录下来,re-scan 再检查一下。这个过程也是会STW的。
  2. Sweep: 按照标记结果回收所有的白色对象,该过程后台并行执行
  3. Sweep Termination: 对未清扫的span进行清扫, 只有上一轮的GC的清扫工作完成才可以开始新一轮的GC。
    如果标记期间用户逻辑改变了刚打完标记的对象的引用状态,怎么办呢?

    写屏障(Write Barrier)

    写屏障:该屏障之前的写操作和之后的写操作相比,先被系统其它组件感知。
    好难懂哦,结合上面GC工作的完整流程就好理解了,就是在每一轮GC开始时会初始化一个叫做“屏障”的东西,然后由它记录第一次scan时各个对象的状态,以便和第二次re-scan进行比对,引用状态变化的对象被标记为灰色以防止丢失,将屏障前后状态未变化对象继续处理。

辅助GC

从上面的GC工作的完整流程可以看出Golang GC实际上把单次暂停时间分散掉了,本来程序执?可能是“?户代码-->?段GC-->?户代码”,那么分散以后实际上变成了“?户代码-->?段 GC-->?户代码-->?段GC-->?户代码”这样。如果GC回收的速度跟不上用户代码分配对象的速度呢?
Go 语?如果发现扫描后回收的速度跟不上分配的速度它依然会把?户逻辑暂停,?户逻辑暂停了以后也就意味着不会有新的对象出现,同时会把?户线程抢过来加?到垃圾回收??加快垃圾回收的速度。这样?来原来的并发还是变成了STW,还是得把?户线程暂停掉,要不然扫描和回收没完没了了停不下来,因为新分配对象?回收快,所以这种东?叫做辅助回收。
## 如何进行GC调优
衡量GC对程序的影响可以参考这篇文章,Go 程序的性能调试问题

减少对象的分配,合理重复利用;
避免string与[]byte转化;

两者发生转换的时候,底层数据结结构会进行复制,因此导致 gc 效率会变低。

少量使用+连接 string;

Go里面string是最基础的类型,是一个只读类型,针对他的每一个操作都会创建一个新的string。
如果是少量小文本拼接,用 “+” 就好;如果是大量小文本拼接,用 strings.Join;如果是大量大文本拼接,用 bytes.Buffer。

GC触发条件

自动垃圾回收的触发条件有两个:

  1. 超过内存大小阈值
  2. 达到定时时间
    阈值是由一个gcpercent的变量控制的,当新分配的内存占已在使用中的内存的比例超过gcprecent时就会触发。比如一次回收完毕后,内存的使用量为5M,那么下次回收的时机则是内存分配达到10M的时候。也就是说,并不是内存分配越多,垃圾回收频率越高。
    如果一直达不到内存大小的阈值呢?这个时候GC就会被定时时间触发,比如一直达不到10M,那就定时(默认2min触发一次)触发一次GC保证资源的回收。

写在最后

虽然Golang有自动垃圾回收机制,但是GC不是万能的,最好还是养成手动回收内存的习惯:比如手动把不再使用的内存释放,把对象置成nil,也可以考虑在合适的时候调用runtime.GC()触发GC。

近期在维护的go学习示例代码,新入坑的朋友们可以关注下
go-programming

参考:

string讨论

Go语言——垃圾回收GC

Golang 垃圾回收剖析

Golang垃圾回收机制详解

go垃圾回收概要

常见GC算法及Golang GC

原文地址:https://www.cnblogs.com/CodeWithTxT/p/11366643.html

时间: 2024-10-29 19:55:20

搞懂Go垃圾回收的相关文章

一文搞定Python垃圾回收机制

python作为一门解释型语言,以代码简洁易懂著称.我们可以直接对名称赋值,而不必声明类型.名称类型的确定.内存空间的分配与释放都是由python解释器在运行时进行的.python这一自动管理内存功能极大的减小了程序员负担,这也是成就python自身的重要原因之一.所以,这一篇文章我们就聊一聊python的内存管理. 引用计数 Python中,主要通过引用计数(Reference Counting)进行垃圾回收. Copy 1234 typedef struct_object { int ob_

垃圾回收G1日志解析

G1垃圾回收器介绍 首先要搞清楚G1垃圾回收的过程 主要分为下面4个步骤: 初始标记(Initial Marking)           由于常规标记对象是否直接关联到GC roots,过程简单,停顿时间短 并发标记(Concurrent Marking) 由于可达性性分析,存在较长停顿 最终标记(Final Marking)           由于把并发标记时漏掉的那部分垃圾内存标记起来,比较少,停顿时间短 筛选回收(Live Data Couting and Evacuation)  对

JVM(二)垃圾回收

要弄懂JVM的垃圾回收,首先要知道我们要回收什么,在哪回收,什么时候回收. 一.JVM内存模型 java虚拟机把内存模型分为了这么几部分 (1)程序计数器 程序计数器(Program Counter Register)是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器. (2)Java虚拟机栈 用于存放局部变量表.操作数栈.动态链接.返回地址等. 局部变量表存放了编译期间可知的各种基本数据类型(boolean.byte.char.short.int.float.long.

看完这篇垃圾回收,和面试官扯皮没问题了

前言 Java 相比 C/C++ 最显著的特点便是引入了自动垃圾回收 (下文统一用 GC 指代自动垃圾回收),它解决了 C/C++ 最令人头疼的内存管理问题,让程序员专注于程序本身,不用关心内存回收这些恼人的问题,这也是 Java 能大行其道的重要原因之一,GC 真正让程序员的生产力得到了释放,但是程序员很难感知到它的存在,这就好比,我们吃完饭后在桌上放下餐盘即走,服务员会替你收拾好这些餐盘,你不会关心服务员什么时候来收,怎么收. 有人说既然 GC 已经自动我们完成了清理,不了解 GC 貌似也没

jvm的stack和heap,JVM内存模型,垃圾回收策略,分代收集,增量收集(转)

深入Java虚拟机:JVM中的Stack和Heap(转自:http://www.cnblogs.com/laoyangHJ/archive/2011/08/17/gc-Stack.html) 在JVM中,内存分为两个部分,Stack(栈)和Heap(堆),这里,我们从JVM的内存管理原理的角度来认识Stack和Heap,并通过这些原理认清Java中静态方法和静态属性的问题. 一般,JVM的内存分为两部分:Stack和Heap. Stack(栈)是JVM的内存指令区.Stack管理很简单,push

闭包内的微观世界和js垃圾回收机制

一.什么是闭包? 官方”的解释是:闭包是一个拥有许多变量和绑定了这些变量的环境的表达式(通常是一个函数),因而这些变量也是该表达式的一部分.相信很少有人能直接看懂这句话,因为他描述的太学术.其实这句话通俗的来说就是:JavaScript中所有的function都是一个闭包.不过一般来说,嵌套的function所产生的闭包更为强大,也是大部分时候我们所谓的“闭包”.看下面这段代码:function a() {var i = 0;function b() { alert(++i); }return

成为JavaGC专家(2)—如何监控Java垃圾回收机制

本文作者: ImportNew - 王晓杰 未经许可,禁止转载! 本文是成为Java GC专家系列文章的第二篇.在第一篇<深入浅出Java垃圾回收机制>中我们学习了不同GC算法的执行过程,GC是如何工作的,什么是新生代和老年代,你应该了解的JDK7中的5种GC类型,以及这5种类型对于应用性能的影响. 在本文中,我将解释JVM到底是如何执行垃圾回收处理的. 什么是GC监控? 垃圾回收收集监控指的是搞清楚JVM如何执行GC的过程,例如,我们可以查明: 1.        何时一个新生代中的对象被移

(转载)虚幻引擎3--UE3垃圾回收机制

原文地址 要进行垃圾回收,有两个条件:一.要知道所有的对象放在哪里,即内存中的位置.二.要知道对象的这块内存上,数据表示的是什么意思,是一个Float数还是Int数还是一个对象指针的值.具备这两个条件,才可以遍历所有的对象,找出没有被引用的对象,然后删除释放掉. U3是如何满足这两个条件的呢,先看第一个. U3里几乎所有的类,都以UObject为基类,一般核心基类都尽量做得简洁明了,但UObject却很复杂,有大量的static成员变量和成员函数,来实现包括对象构造.对象管理.垃圾回收.资源加载

理解Android Java垃圾回收机制

Jvm(Java虚拟机)内存模型 从Jvm内存模型中入手对于理解GC会有很大的帮助,不过这里只需要了解一个大概,说多了反而混淆视线. Jvm(Java虚拟机)主要管理两种类型内存:堆和非堆.堆是运行时数据区域,所有类实例和数组的内存均从此处分配.非堆是JVM留给自己用的,包含方法区.JVM内部处理或优化所需的内存(如 JIT Compiler,Just-in-time Compiler,即时编译后的代码缓存).每个类结构(如运行时常数池.字段和方法数据)以及方法和构造方法的代码. 简言之,Jav