【图解JDK源码】HashMap的基本原理与它的线程安全性

1. 前言

能用图说清楚的,就坚决不用代码。能用代码撸清楚的,就坚决不写解释(不是不写注释哦)。

以下所有仅针对JDK 1.7及之前中的HashMap。

2. 数据结构

HashMap内部通过维护一个Entry<K, V>数组(变量为table),来实现其基本功能,而Entry<K, V>是HashMap的内部类,其主要作用便是存储键值对,其数据结构大致如下图所示。

从Entry的数据结构可以看出,多个Entry是可以形成一个单向链表的,HashMap中维护的Entry<K, V>数组(之后简称为Entry数组,或table,容易区分)其实就是存储的一系列Entry<K, V>链表的表头。那么HashMap中存储数据table数组的数据结构,大致可以如下图所示(假设只有部分数据)。

注:Entry数组的默认长度为16,负载因子为0.75。

将上图中的每一行,称为桶(bucket),那么table的索引便是bucketIndex。而HashMap中的插入、获取、删除等操作最主要的便是对table和桶(bucket)的操作。下面将主要通过插入操作,看其数据结构的变化。

3. 插入

对于上图中的数据结构,插入操作便是将要插入的键 - 值(key - value)对根据key计算hash值来选择具体的存储位置。

插入函数的源码如下(以Mark开头的或者中文注释,非JDK源码中的注释,下同):

public V put(K key, V value) {
    // Mark A Begin
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    if (key == null)
        return putForNullKey(value);
    // Mark A End

    int hash = hash(key); // 计算hash值
    int i = indexFor(hash, table.length); // 计算桶的位置索引(bucketIndex)

    // Mark B begin
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    // Mark B end

    modCount++; // 记录修改次数,迭代的时候会据此判断是否有被修改
    addEntry(hash, key, value, i);
    return null;
}

在上面的代码中,代码段A(Mark A Begin - Mark A End,下同)的主要作用是如果table为空则初始化数组以及插入key为null时的操作,代码段B则是插入相同key时覆盖原有的值,并返回原有的值。这里重点关注的是addEntry(hash, key, value, i)方法。

addEntry方法源码如下:

void addEntry(int hash, K key, V value, int bucketIndex) {
    if ((size >= threshold) && (null != table[bucketIndex])) {
        // 扩充table数组的大小
        resize(2 * table.length);
        // 重新计算hash值
        hash = (null != key) ? hash(key) : 0;
        // 重新计算桶的位置索引
        bucketIndex = indexFor(hash, table.length);
    }

    createEntry(hash, key, value, bucketIndex);
}

createEntry方法源码如下:

void createEntry(int hash, K key, V value, int bucketIndex) {
    Entry<K,V> e = table[bucketIndex];
    // 将新的Enrty元素插入到对应桶的表头
    table[bucketIndex] = new Entry<>(hash, key, value, e);
    size++;
}

Entry<>实例化的源码如下:

Entry(int h, K k, V v, Entry<K,V> n) {
    value = v;
    next = n; // 将原先桶的表头向后移动
    key = k;
    hash = h;
}

在整个插入操作中,有一个很重要的操作,便是对table数组扩容,扩容的算法相对简单,但是在多线程下它却容易引发一个线程安全的问题。

注:扩容需要会把原先table中的值移动到新的数组中,再赋值给table变量,一个合适的初始大小和负载因子能够提高效率。

4. 线程不安全

在多线程环境下,假设有容器map,其存储的情况如下图所示(淡蓝色为已有数据)。

此时的map已经达到了扩容阈值12(16 * 0.75 = 12),而此时线程A与线程B同时对map容器进行插入操作,那么都需要扩容。此时可能出现的情况如下:线程A与线程B都进行了扩容,此时便有两个新的table,那么再赋值给原先的table变量时,便会出现其中一个newTable会被覆盖,假如线程B扩容的newTable覆盖了线程A扩容的newTable,并且是在A已经执行了插入操作之后,那么就会出现线程A的插入失效问题,也即是如下图中的两个table只能有一个会最后存在,而其中一个插入的值会被舍弃的问题。

这便是HashMap的线程不安全性,当然这只是其中的一点。而要消除这种隐患,则可以加锁或使用HashTable和ConcurrentHashMap这样的线程安全类,但是HashTable不被建议使用,推荐使用ConcurrentHashMap容器。

时间: 2024-08-03 03:21:46

【图解JDK源码】HashMap的基本原理与它的线程安全性的相关文章

【图解JDK源码】HashMap的容量大小增长原理(JDK1.6/1.7/1.8)

1. 前言 HashMap的容量大小会根据其存储数据的数量多少而自动扩充,即当HashMap存储数据的数量到达一个阈值(threshold)时,再往里面增加数据,便可能会扩充HashMap的容量. 可能? 事实上,由于JDK版本的不同,其阈值(threshold)的默认大小也变得不同(主要是计算公式的改变),甚至连判断条件也变得不一样,所以如果说threshold = capacity * loadFactor(容量 * 负载因子)将不再绝对正确,甚至说超过阈值容量就会增长也不再绝对正确,下面就

JDK源码-HashMap

1,Map:映射表数据结构,通过key-value完成映射.HashMap的子实现主要包括:HashMap.LinkedHashMap.TreeMap.WeakHashMap.ConcurrentHashMap.IdentityHashMap.以下总结摘录自<Thingking In Java> -1,HashMap:使用Map集合的默认选择.因为HashMap对速度进行了优化.HashMap是Map基于散列表的实现,并取代了Hashtable.插入和查询的效率相对固定.可以通过构造器设置容量

jdk源码——HashMap

JDK1.7 从源码上看,HashMap 实现了Map接口 cloneable接口,和序列化接口 public class HashMap<K,V>    extends AbstractMap<K,V>    implements Map<K,V>, Cloneable, Serializable{ HashMap的默认初始容量为16 static final int DEFAULT_INITIAL_CAPACITY = 16; HashMap最大容量为2^30 st

JDK源码--HashMap(之resize)

1.HashMap源码阅读目标了解具体的数据结构(hash及冲突链表.红黑树)和重要方法的具体实现(hashCode.equals.put.resize...) 2.重要方法 hashCode 与 equals都是在AbstractMap中定义的 hashCode是各元素hash的累加 h += iter.next().hashCode(); equals 1.是否是本身; 2.是否是Map实例; 3.size是否相等; 4.比较每个value 重点在于put.resize具体实现步骤: put

jdk源码hashMap的1.7与1.8的比较

1.8链表的定义基本上与1.7相同,但是类名改为Node,但是node实现了Map.Entry接口,实质是一样的 static class Node<K,V> implements Map.Entry<K,V> { 1.8的hash值的算法更加直观一点,就是key的hashcode与无符号右移16位的hashcode异或,然后返回.这是为了当length比较小的时候,也能保证考虑到高低Bit位都参与到Hash的计算中,同时不会有太大的开销. static final int has

由JDK源码学习HashMap

HashMap基于hash表的Map接口实现,它实现了Map接口中的所有操作.HashMap允许存储null键和null值.这是它与Hashtable的区别之一(另外一个区别是Hashtable是线程安全的).另外,HashMap中的键值对是无序的.下面,我们从HashMap的源代码来分析HashMap的实现,以下使用的是Jdk1.7.0_51. 一.HashMap的存储实现 HashMap底层采用的是数组和链表这两种数据结构.当我们把key-value对put到HashMap时,系统会根据ha

jdk源码阅读-HashMap

前置阅读: jdk源码阅读-Map : http://www.cnblogs.com/ccode/p/4645683.html 在前置阅读的文章里,已经提到HashMap是基于Hash表实现的,所以在讲解HashMap之前 ,有必要提前了解下Hash的原理. 参考<算法导论><算法>

JDK源码笔记-java.util.HashMap

HashMap 的存储实现 当程序试图将多个 key-value 放入 HashMap 中时,以如下代码片段为例: Java代码 HashMap<String , Double> map = new HashMap<String , Double>(); map.put("语文" , 80.0); map.put("数学" , 89.0); map.put("英语" , 78.2); HashMap 采用一种所谓的&quo

阅读JDK源码有感

最近加班不是很严重,爱上了查看JDK源码,每天回来,准备一杯咖啡,开始阅读,受益良多.从上周开始阅读,觉得还是写下感想和学习心得比较好.以后每天阅读,每天记下收获.总体来说,我觉得JDK源码写得十分漂亮,无论是从代码风格还是从重用性来说,都是相当出色的.之前阅读过Thinking in java,感觉很多东西都不能深入理解,太过于理论化,现在结合JDK看来,又别有一番感悟.以前每次有面试,都会从网上收集一些面试题,死记硬背一些知识,HashMap与HashTable的区别啊之类的,但是看了JDK