ConcurrentHashMap 源码阅读小结

前言

每一次总结都意味着重新开始,同时也是为了更好的开始。ConcurrentHashMap 一直是我心中的痛。虽然不敢说完全读懂了,但也看了几个重要的方法,有不少我觉得比较重要的知识点。

然后呢,放一些楼主写的关于 ConcurrentHashMap 相关源码分析的文章链接:

  1. ConcurrentHashMap 扩容分析拾遗
  2. 并发编程——ConcurrentHashMap#addCount() 分析
  3. 并发编程——ConcurrentHashMap#transfer() 扩容逐行分析
  4. 并发编程——ConcurrentHashMap#helpTransfer() 分析
  5. 并发编程 —— ConcurrentHashMap size 方法原理分析
  6. 并发编程之 ConcurrentHashMap(JDK 1.8) putVal 源码分析
  7. 深入理解 HashMap put 方法(JDK 8逐行剖析)
  8. 深入理解 hashcode 和 hash 算法

putVal 方法总结

说起 ConcurrentHashMap ,当然从入口开始说。该方法要点如下:

  1. 不允许有 null key 和 null value。
  2. 只有在第一次 put 的时候才初始化 table。初始化有并发控制。通过 sizeCtl 变量判断(小于 0)。
  3. 当 hash 对应的下标是 null 时,使用 CAS 插入元素。
  4. 当 hash 对应的下标值是 forward 时,帮助扩容,但有可能帮不了,因为每个线程默认 16 个桶,如果只有 16个桶,第二个线程是无法帮助扩容的。
  5. 如果 hash 冲突了,同步头节点,进行链表操作,如果链表长度达到 8 ,分成红黑树。
  6. 调用 addCount 方法,对 size 加一,并判断是否需要扩容(如果是覆盖,就不调用该方法)。
  7. Cmap 的并发性能是 hashTable 的 table.length 倍。只有出现链表才会同步,否则使用 CAS 插入。性能极高。

size 方法总结

  1. size 方法不准确,原因是由于并发插入,baseCount 难以及时更新。计数盒子也难以及时更新。
  2. 内部通过两个变量,一个是 baseCount,一个是 counterCells,counterCells 是并发修改 baseCount 后的备用方案。
  3. 具体更新 baseCount 和 counterCells 是在 addCount 方法中。备用方法 fullAddCount 则会死循环插入。
  4. CounterCell 是一个用于分配计数的填充单元,改编自 LongAdder和Striped64。内部只有一个 volatile 的 value 变量,同时这个类标记了 @sun.misc.Contended,这是一个避免伪共享的注解,用于替代之前的缓存行填充。多线程情况下,注解让性能提升 5 倍。

helpTransfer 方法总结

  1. 当 Cmap 尝试插入的时候,发现该节点是 forward 类型,则会帮助其扩容。
  2. 每次加入一个线程都会将 sizeCtl 的低 16 位加一。同时会校验高 16 位的标示符。
  3. 扩容最大的帮助线程是 65535,这是低 16 位的最大值限制的。
  4. 每个线程默认分配 16 个桶,如果桶的数量是 16,那么第二个线程无法帮助其扩容。

transfer 方法总结

  1. 该方法会根据 CPU 核心数平均分配给每个 CPU 相同数量的桶。但如果不够 16 个,默认就是 16 个。
  2. 扩容是按照 2 倍进行扩容。
  3. 每个线程在处理完自己领取的区间后,还可以继续领取,如果有的话。这个是 transferIndex 变量递减 16 实现的。
  4. 每次处理空桶的时候,会插入一个 forward 节点,告诉 putVal 的线程:“我正在扩容,快来帮忙”。但如果只有 16 个桶,只能有一个线程扩容。
  5. 如果有了占位符,那就不处理,跳过这个桶。
  6. 如果有真正的实际值,那就同步头节点,防止 putVal 那里并发。
  7. 同步块里会将链表拆成两份,根据 hash & length 得到是否是 0,如果是0,放在低位,反之,反之放在 length + i 的高位。这里的设计是为了防止下次取值的时候,hash 不到正确的位置。
  8. 如果该桶的类型是红黑树,也会拆成 2 个,这是必须的。然后判断拆分过的桶的大小是否小于等于 6,如果是,改成链表。
  9. 线程处理完之后,如果没有可选区间,且任务没有完成,就会将整个表检查一遍,防止遗漏。

addCount 方法总结

  1. 当插入结束的时候,会对 size 进行加一。也会进行是否需要扩容的判断。
  2. 优先使用计数盒子(如果不是空,说明并发了),如果计数盒子是空,使用 baseCount 变量。对其加 X。
  3. 如果修改 baseCount 失败,使用计数盒子。如果此次修改失败,在另一个方法死循环插入。
  4. 检查是否需要扩容。
  5. 如果 size 大于等于 sizeCtl 阈值,且长度小于 1 << 30,可以扩容成 1 << 30,但不能扩容成 1 << 31。
  6. 如果已经在扩容,帮助其扩容,和 helpTransfer 逻辑一样。
  7. 如果没有在扩容,自行开启扩容,更新 sizeCtl 变量为负数,赋值为标识符高 16 位 + 2。

小结

ConcurrentHashMap 满是财富,都是精华代码,我们这次阅读只是管中窥豹,要知道其中包含 53 个类,6300 行代码,但这次确实收获很多。有时间一定再次阅读!!

能力不高,水平有限,有些地方确实理解不了 Doug Lea 大师的设计,如果有什么错误,还请大家指出。不胜感激。

原文地址:https://www.cnblogs.com/stateis0/p/9062095.html

时间: 2024-10-02 06:08:36

ConcurrentHashMap 源码阅读小结的相关文章

ConcurrentHashMap源码阅读以及底层实现的简单分析

ConcurrentHashMap 是可以实现多线程并发的HashMap,它是线程安全的. 前面分析过 HashMap的源码,它和HashMap有很多的相同点一样,比如它也有 initialCapacity 以及负载因子 loadFactor 属性.而且他们的默认值也是16和0.75. static final int DEFAULT_INITIAL_CAPACITY =16; static final float DEFAULT_LOAD_FACTOR =0.75f; 和HashMap不同的是

JDK1.8 ConcurrentHashMap源码阅读

1.  带着问题去阅读 为什么说ConcurrentHashMap是线程安全的?或者说 ConcurrentHashMap是如何防止并发的? 2.  字段和常量 首先,来看一下ConcurrentHashMap中的一些字段和常量,这些在接下来的操作中会用得到 2.1.  常量 从中,我们可以获得以下信息: 数组的默认容量是16,最大容量是1<<30 当添加元素的时候,将列表转成树的阈值是8.也就是说,相同位置上多个元素是以链表的形式存储的,而当链表的长度(元素的个数)超过8时,将其转为树 在对

Java7、8中HashMap和ConcurrentHashMap源码阅读

首先来看下HashMap的类继承结构: public class HashMap extends AbstractMap<K,V> impement Map<K,V>,Coloneable,Serializable{ } 可以看出HashMap实现了Map接口.其里面的方法都是非线程安全的,且不支持并发操作.对于HashMap主要看的是get/put方法实现,其在jdk1.7,及1.8在解决哈希冲突的上有所不同.一.Java7 HashMap 从上面的结构图中,可以大致看出,Has

【源码阅读系列】JDK 8 ConcurrentHashMap 源码分析之 由transfer引发的bug

不阅读源码就不会发现这个事儿 前段时间在阅读ConcurrentHashMap源码,版本JDK 8,目前源码研究已经告一段落.感谢鲁道的ConcurrentHashMap源码分析文章,读到文章,感觉和作者发生了一些交流,解答了很多疑惑,也验证了一些想法.鲁道在简书的addCount分析文章点这里 (文章底部的评论中就有这篇文章发酵的原由).鲁道还有其他ConcurrentHashMap源码分析的系列文章,在简书.掘金都有分布,感兴趣的同学可以进一步追踪. 推完文章,回到本篇的主题"阅读源码&qu

Java Jdk1.8 HashMap源码阅读笔记二

三.源码阅读 3.元素包含containsKey(Object key) /** * Returns <tt>true</tt> if this map contains a mapping for the * specified key. * * @param key The key whose presence in this map is to be tested * @return <tt>true</tt> if this map contains

【原】SDWebImage源码阅读(五)

[原]SDWebImage源码阅读(五) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 前面的代码并没有特意去讲SDWebImage的缓存机制,主要是想单独开一章节专门讲解缓存.之前我们也遇到一些缓存的属性和方法,比如storeImage.queryDiskCacheForKey.memCache等等. SDWebImage的缓存分为两个部分,一个内存缓存,使用NSCache实现,另一个就是硬盘缓存(disk),使用NSFileManager实现. 不过这么多函数,

Java Jdk1.8 HashMap源码阅读笔记一

最近在工作用到Map等一系列的集合,于是,想仔细看一下其具体实现. 一.结构 public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable 1.抽象类AbstractMap public abstract class AbstractMap<K,V> implements Map<K,V> 该类实现了Map接口,具体结

log4j源码阅读(一)之Logger

概述 log4j是一款非常方便而且强大的开源日志项目,在经过简单的配置后,可以达到相当不错的效果. 头脑一热决定对log4j的源码进行一定的阅读,其初衷是希望通过源码的阅读,提高写代码的能力. log4j其核心概念可分为: logger 日志接收器,即程序员在自己的代码中使用如logger.error(...)的形式记录日志. append 日志写出器,将logger接收到的日志信息写入到各种设备,如文件,控制台. layout 日志格式化器,将输入的日志先进行格式化,再输出. log4j将日志

[PHP源码阅读]trim、rtrim、ltrim函数

trim系列函数是用于去除字符串中首尾的空格或其他字符.ltrim函数只去除掉字符串首部的字符,rtrim函数只去除字符串尾部的字符. trim string trim ( string $str [, string $character_mask = " \t\n\r\0\x0B" ] ) 参数说明 character_mask默认是" \t\n\r\0\x0B"等空白字符. 使用..可以指定一段范围的字符.此处要注意,".."左右两边是一对合