集合 HashMap 的原理,与 Hashtable、ConcurrentHashMap 的区别

一、HashMap 的原理

1.HashMap简介

简单来讲,HashMap底层是由数组+链表的形式实现,数组是HashMap的主体,链表则是主要为了解决哈希冲突而存在的,如果定位到的数组位置不含链表(当前entry的next指向null),那么对于查找,添加等操作很快,仅需一次寻址即可;如果定位到的数组包含链表,对于添加操作,首先遍历链表,存在即覆盖,否则新增;对于查找操作来讲,仍需遍历链表,然后通过key对象的equals方法逐一比对查找。当新建一个HashMap的时候,就会初始化一个数组(数组默认大小是16),可以允许存入null键和null值,线程不安全。

源码如下:

/**
 * The table, resized as necessary. Length MUST Always be a power of two.
 */
transient Entry[] table;

static class Entry<K,V> implements Map.Entry<K,V> {
    final K key;
    V value;
    Entry<K,V> next;
    final int hash;
    ……
}

可以看出,Entry就是数组中的元素,每个 Map.Entry 其实就是一个key-value对,它持有一个指向下一个元素的引用,这就构成了链表。

2.HashMap存储和读取 源码如下:

 1 //存储
 2 public V put(K key, V value) {
 3     // HashMap允许存放null键和null值。
 4     // 当key为null时,调用putForNullKey方法,将value放置在数组第一个位置。
 5     if (key == null)
 6         return putForNullKey(value);
 7     // 根据key的keyCode重新计算hash值。
 8     int hash = hash(key.hashCode());
 9     // 搜索指定hash值在对应table中的索引。
10     int i = indexFor(hash, table.length);
11     // 如果 i 索引处的 Entry 不为 null,通过循环不断遍历 e 元素的下一个元素。
12     for (Entry<K,V> e = table[i]; e != null; e = e.next) {
13         Object k;
14         if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
15             // 如果发现已有该键值,则存储新的值,并返回原始值
16             V oldValue = e.value;
17             e.value = value;
18             e.recordAccess(this);
19             return oldValue;
20         }
21     }
22     // 如果i索引处的Entry为null,表明此处还没有Entry。
23     modCount++;
24     // 将key、value添加到i索引处。
25     addEntry(hash, key, value, i);
26     return null;
27 }
28
29 //读取
30 public V get(Object key) {
31     if (key == null)
32         return getForNullKey();
33     int hash = hash(key.hashCode());
34     for (Entry<K,V> e = table[indexFor(hash, table.length)];
35         e != null;
36         e = e.next) {
37         Object k;
38         if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
39             return e.value;
40     }
41     return null;
42 }
43
44 //hash算法
45 static int hash(int h) {
46     h ^= (h >>> 20) ^ (h >>> 12);
47     return h ^ (h >>> 7) ^ (h >>> 4);
48 }

根据hash值得到这个元素在数组中的位置(即下标),如果数组该位置上已经存放有其他元素了,那么在这个位置上的元素将以链表的形式存放,新加入的放在链头,最先加入的放在链尾。如果数组该位置上没有元素,就直接将该元素放到此数组中的该位置上。

我们可以看到在HashMap中要找到某个元素,需要根据key的hash值来求得对应数组中的位置。如何计算这个位置就是hash算法。前面说过HashMap的数据结构是数组和链表的结合,所以我们当然希望这个HashMap里面的元素位置尽量的分布均匀些,尽量使得每个位置上的元素数量只有一个,那么当我们用hash算法求得这个位置的时候,马上就可以知道对应位置的元素就是我们要的,而不用再去遍历链表,这样就大大优化了查询的效率。

根据上面 put 方法的源代码可以看出,当程序试图将一个key-value对放入HashMap中时,程序首先根据该 key的 hashCode() 返回值决定该 Entry 的存储位置:如果两个 Entry 的 key 的 hashCode() 返回值相同,那它们的存储位置相同。如果这两个 Entry 的 key 通过 equals 比较返回 true,新添加 Entry 的 value 将覆盖集合中原有 Entry的 value,但key不会覆盖。如果这两个 Entry 的 key 通过 equals 比较返回 false,新添加的 Entry 将与集合中原有 Entry 形成 Entry 链,而且新添加的 Entry 位于 Entry 链的头部——具体说明继续看 addEntry() 方法的说明。从HashMap中get元素时,首先计算key的hashCode,找到数组中对应位置的某一元素,然后通过key的equals方法在对应位置的链表中找到需要的元素。

3.归纳总结:

HashMap 在底层将 key-value 当成一个整体进行处理,这个整体就是一个 Entry 对象。HashMap 底层采用一个 Entry[] 数组来保存所有的 key-value 对,当需要存储一个 Entry 对象时,会根据hash算法来决定其在数组中的存储位置,在根据equals方法决定其在该数组位置上的链表中的存储位置;当需要取出一个Entry时,也会根据hash算法找到其在数组中的存储位置,再根据equals方法从该位置上的链表中取出该Entry。

4.上面HashMap原理是基于JDK1.7介绍的,在JDK1.8中对HashMap进行了优化:

JDK1.7中一个很明显的地方是:当 Hash 冲突严重时,在数组上形成的链表会变的越来越长,这样在查询时的效率就会越来越低;时间复杂度为 O(N)

因此 1.8 中重点优化了这个查询效率。区别具体体现在:1.增加了TREEIFY_THRESHOLD 用于判断是否需要将链表转换为红黑树的阈值(默认是8),一旦链表中的数据较多(即>8个)之后,就会转用红黑树来进行存储,优化存储速度,查询效率也直接提高到了 O(logn);2.HashEntry 修改为 Node,Node 的核心组成其实也是和 1.7 中的 HashEntry 一样,存放的都是 key value hashcode next 等数据。

二、HashMap 与 Hashtable、ConcurrentHashMap 的区别

 
  HashTable HashMap ConcurrentHashMap
底层数据结构 数组+链表 数组+链表 数组+链表
key可为空
value可为空
线程安全
默认初始容量 11 16 16
扩容方式 (oldSize << 1)+1 oldSize << 1 桶的扩容
扩容时间 size超过(容量*负载因子) size超过(容量*负载因子) 桶超数超过(容量*负载因子)
hash key.hashCode() (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16) (key.hashCode() ^ (key.hashCode() >>> 16)) & 0x7fffffff
index计算方式 (hash & 0x7FFFFFFF) % tab.length (tab.length - 1) & hash (tab.length - 1) & hash
默认负载因子 0.75f 0.75f 0.75f

三者主要区别:

1.存储时key、value能否为空问题:

HashTable和ConcurrentHashMap都不允许NULL键和NULL值,而HashMap允许

2.线程安全问题:
HashMap仅限运用于单线程,在多线程中可能存在问题,是线程不安全的;而HashTable和ConcurrentHashMap都是线程安全的。

HashTable实现线程安全的方式是在修改数据时锁住整个HashTable,让当前线程独占,效率低,而ConcurrentHashMap对此做了相关优化,ConcurrentHashMap通过把整个Map分为N个Segment(分段),在修改数据时会局部锁住某段部分数据,但不会把整个表都锁住。ConcurrentHashMap读操作不加锁,由于HashEntry的value变量是 volatile的,也能保证读取到最新的值。因为volatile定义的变量保证了对所有线程可见。

参考博文:

http://www.cnblogs.com/yuanblog/p/4441017.html

原文地址:https://www.cnblogs.com/sawyerFly/p/11666919.html

时间: 2024-10-16 13:35:23

集合 HashMap 的原理,与 Hashtable、ConcurrentHashMap 的区别的相关文章

1.Java集合-HashMap实现原理及源码分析

哈希表(Hash  Table)也叫散列表,是一种非常重要的数据结构,应用场景及其丰富,许多缓存技术(比如memcached)的核心其实就是在内存中维护一张大的哈希表,而HashMap的实现原理也常常出现在各类的面试题中,这里对java集合框架中的对应实现HashMap的实现原理进行讲解,然后对JDK7的HashMap的源码进行分析 哈希算法,是一类算法: 哈希表(Hash  Table)是一种数据结构: 哈希函数:是支撑哈希表的一类函数: HashMap 是 Java中用哈希数据结构实现的Ma

HashMap Hashtable ConcurrentHashMap 一点区别

HashMap  ConcurrentHashMap Hashtable 工作中经常会用到, HashMap用的最多, ConcurrentHashMap次之,hashTable用的最少. 简单看了下源码,其实原因还是挺明显的.从JDK的发展历程来看,hashTable是1.0就发布的,属于最早的key-value形式的存储, 到了1.2才有hashMap, ConcurrentHashMap是1.5中发布的,它们的实现有很多类同,也有很多细节上的区别.这里主要通过查看源码来比较下它们在写入与读

HashMap、TreeMap、Hashtable、LinkedHashMap区别

HashMap 允许设置key和value为null,key存放是乱序的,不支持线程的同步,即任一时刻可以有多个线程同时写HashMap;可能会导致数据的不一致.如果需要同步,可以用 Collections的synchronizedMap方法使HashMap具有同步的能力,或者使用ConcurrentHashMap,访问速度快,因为它根据key的HashCode 值来存储数据 public static void main(String[] args) { System.out.println(

[Java集合] 彻底搞懂HashMap,HashTable,ConcurrentHashMap之关联.

注: 今天看到的一篇讲hashMap,hashTable,concurrentHashMap很透彻的一篇文章, 感谢原作者的分享. 原文地址: http://blog.csdn.net/zhangerqing/article/details/8193118 Java集合类是个非常重要的知识点,HashMap.HashTable.ConcurrentHashMap等算是集合类中的重点,可谓"重中之重",首先来看个问题,如面试官问你:HashMap和HashTable有什么区别,一个比较简

Java集合——HashMap、HashTable以及ConCurrentHashMap异同比较

0. 前言 HashMap和HashTable的区别一种比较简单的回答是: (1)HashMap是非线程安全的,HashTable是线程安全的. (2)HashMap的键和值都允许有null存在,而HashTable则都不行. (3)因为线程安全.哈希效率的问题,HashMap效率比HashTable的要高. 但是如果继续追问:Java中的另一个线程安全的与HashMap功能极其类似的类是什么? 同样是线程安全,它与HashTable在线程同步上有什么不同?带着这些问题,开始今天的文章. 本文为

Hashtable,HashMap实现原理

http://blog.csdn.net/czh0766/article/details/5260360 昨天看了算法导论对散列表的介绍,今天看了一下Hashtable, HashMap这两个类的源代码,并参考了网上的一些观点,对它们的实现有了大概的理解.原来hashtable里的key-value还是用数组存储的,数组元素是Entry<K,V>类型,同一数组索引下储存的实质是一个Entry链表,Entry中的next值指向下一个Entry.当把key-value放进hashtable时,会根

HashMap、HashTable和concurrentHashMap的区别

HashMap和Hashtable的区别 HashMap和Hashtable都实现了Map接口,但决定用哪一个之前先要弄清楚它们之间的分别.主要的区别有:线程安全性,同步(synchronization),以及速度. HashMap几乎可以等价于Hashtable,除了HashMap是非synchronized的,并可以接受null(HashMap可以接受为null的键值(key)和值(value),而Hashtable则不行). HashMap是非synchronized,而Hashtable

JVM里面hashtable和hashmap实现原理

JVM里面hashtable和hashmap实现原理 文章分类:Java编程 转载 在hashtable和hashmap是java里面常见的容器类, 是Java.uitl包下面的类, 那么Hashtable和Hashmap是怎么实现hash键值对配对的呢,我们看看jdk里面的源码,分析下Hashtable的构造方法,put(K, V)加入方法和get(Object)方法就大概明白了. 一.Hashtable的构造方法:Hashtable(int initialCapacity, float lo

HashMap HashTable ConcurrentHashMap 简单比较

1. HashMap HashTable ConcurrentHashMap都是java哈希算法的实现,其中HashMap是非线程安全的,HashTable 和ConcurrentHashMap是线程安全的.单线程环境下HashMap更有速度优势. 2. HashTable 的实现方式比较简单粗暴,直接对修改操作进行加锁来控制并发访问. 3. ConcurrentHashMap,通过分段(segment)来提高并发性能,进行修改操作时,只是对相应的段进行加锁,理论上段个数的线程可以并行访问Con