HashMap的底层实现原理是什么?

HashMap的结构和底层实现原理是什么?

HashMap用的是非常常见的结构:数组和链表的结合的数据结构。数组的每个地方都存了Key-Value这样的实例,在JDK8中交做Node实例。因为数组本身所有的位置都为null,所以在put的时候会根据key值hash算出一个index值。但是数组的长度是有限的,当我们在有限的长度下使用随机的Hash函数时,就有机会是的两个key的Hash相同。那么这时候就需要在原来的数组位置上尾插一个(node)形成一个链表。每一个节点都会保存自身的Hash、Key、value、及下个节点。我们来看一下node的源码是什么样的呢?

static class Node<K,V> implements Map.Entry<K,V>{
final int hash;
final K key;
final V value;
Node<K,V> next;
}

那么在JDK7中的头插和JDK8中的尾插的区别在哪呢?为什么要进行这样的改变呢?

头插法是什么意思呢?就是新来的值会取代原来的值,原有的值会顺推到链表中去,这主要是因为当时设计师认为后面插入的值查找的概率会比前面的值查找的概率大。那么为什么后来却改成了尾插呢?我们需要从HashMap的扩容机制说起:

数组的容量是有限的,那么在到达一定的数量的时候必然会产生扩容的,也就是resize。那么什么时候去resize呢?

有两个因素:Capacity:HashMap当前的长度。LoadFactor:负载因子,默认值时0.75f。怎么理解呢?比如当前数组的容量为100,当你存进去76的时候就会进行扩容。但是HashMap的扩容并不是简单的扩大容量那么简单。分为两个步骤:

第一步:扩容,创建一个新的数组,长度时原来数组的两倍。

第二步:ReHash:遍历原来的Entry数组,把所有的Entry重新Hash到新数组当中去。

那么为什么要重新Hash到数组上去呢?(如果这么问就已经问的很底层了)

那么为什么我们要重新Hash而不是复制呢?主要时数组的长度扩大之后,Hash规则也会发生改变。Hash的公式是index=HashCode(Key)&(length-1)也就是长度和key进行位运算。说完了扩容机制之后重新回到为什么我们要变头插改文尾插呢?这是因为头插会形成环形节点。(至于为什么需要画图,而我比较懒。)尾插因为链表有了红黑树的部分,大家可以看到代码里面有了很多的if else判断。红黑树的出现也将原来O(n)降低成了O(logn)。所以使用尾插在扩容时不会出现链表成环的问题。

java7在多线程操作HashMap时可能引起死循环原因就是因为这个,在转移的过程中修改了链表中的节点的引用关系。但是Java8虽然不会引起死循环但是同样不建议在多线程中使用HashMap,这是因为put/get方法中都没有添加同步锁,多线程的情况下最容易出现的情况就是无法保证上一秒put的值在下一秒get的时候还是原值,线程安全同样还是无法保证。

那么对于HashMap最难的问题是什么呢?那就是HashMap的初始值是多少呢?

当然是16。

那么为什么是16呢?

说实话,小编第一次见到有人问这个问题的时候想打人HashMap为啥是16呢,这是因为为了保证均匀分布。在使用不是2的幂的数字是,Length-1的值是所有二进制位全为1,这种情况下,index的结果等同于HashCode后几位的值。只要输入的HashCode本身分布均匀,Hash算法的结果就是均匀的。

那么我们为什么重写equals方法的时候需要重写hashCode方法呢?就拿HashMap来举例子。

因为在java中,所有的对象都是继承于Object类,Object类里面有两个方法equals、hashCode,这两个方法都是用来比较两个对象是否相等的。

在未重写equals方法我们是继承了object中的equals方法,那里的这个方法是比较两个对象的内存地址。那么我们new之后2个对象地址肯定不一样。那么在Hash中我们如何要通过相同的hash值去寻找到我们想要的答案呢?那就是equals方法,所以我们在重写equals的时候建议以一定要对hashCode的方法进行重写,以保证相同的对象返回相同的hash值,不同的对象返回不同的hash值。

原文地址:https://www.cnblogs.com/ffdsj/p/12388900.html

时间: 2024-08-29 17:18:30

HashMap的底层实现原理是什么?的相关文章

Java中HashMap底层实现原理(JDK1.8)源码分析

这几天学习了HashMap的底层实现,但是发现好几个版本的,代码不一,而且看了Android包的HashMap和JDK中的HashMap的也不是一样,原来他们没有指定JDK版本,很多文章都是旧版本JDK1.6.JDK1.7的.现在我来分析一哈最新的JDK1.8的HashMap及性能优化. 在JDK1.6,JDK1.7中,HashMap采用位桶+链表实现,即使用链表处理冲突,同一hash值的链表都存储在一个链表里.但是当位于一个桶中的元素较多,即hash值相等的元素较多时,通过key值依次查找的效

Map的底层实现原理

一,前言 1.1,概述 ? 现实生活中,我们常会看到这样的一种集合:IP地址与主机名,身份证号与个人,系统用户名与系统用户对象等,这种一一对应的关系,就叫做映射(K-V).Java提供了专门的集合类用来存放这种对象关系的对象,即java.util.Map接口. Collection中的集合,元素是孤立存在的(理解为单身),向集合中存储元素采用一个个元素的方式存储. Map中的集合,元素是成对存在的(理解为夫妻).每个元素由键与值两部分组成,通过键(K)可以找对所对应的值(V). Collecti

迭代器Iterator的底层实现原理

第一步:没有接口的迭代器简单实现原理 1 package com.bjsxt.xiaofei; 2 /** 3 * 迭代器底层原理 4 * 方法: 5 * hasNext() 6 * next() 7 * remove() 8 * @ClassName: MyAarryList 9 * @Description: TODO(这里用一句话描述这个类的作用) 10 * @author 尚晓飞 11 * @date 2014-7-29 下午7:06:09 12 * 13 */ 14 public cl

浅议事件异步处理底层实现原理

//主类 package cn.com.likeshow.bluetoothchat; import android.os.Bundle; import android.app.Activity; import android.view.Menu; import android.widget.LinearLayout; import android.widget.TextView; public class MainActivity extends Activity { @Override pr

hashmap的底层实现

HashMap的底层实现都是数组+链表结构实现的,添加.删除.获取元素都是先计算hash值,根据hash值和table.length计算出index也就是table的数组的下标,然后进行相应的操作. 不过HashMap和HashTable计算hash的方法不同: HashMap是直接用key的hashcode对table数组长度取模:而HashMap则是对key的hashcode进行两次hash,以获得更好的散列值,然后再对table数组的长度取模. 具体方法的实现: HashMap默认初始化时

由PHP底层工作原理说起

之前做过.net,java开发,也写过几个Php的网站,似乎3种主要编程语言都接触了.但是越来越觉得自己对编程的整个流程缺乏一个整体的认识,尤其是底层的机制.譬如网络编程,编译原理,服务器端,数据库存储引擎原理等.于是看了一些书,比较经典的有apue,unp,tcp/ip,nginx,mysql的innodb存储引擎,深入理解jvm.渐渐发现无论用什么语言做开发,背后都有linux,shell,c/c++,nginx服务器,mysql的身影.也许只有掌握了这些核心的原理知识,一个程序员才具有核心

详解HashMap的内部工作原理

本文将用一个简单的例子来解释下HashMap内部的工作原理.首先我们从一个例子开始,而不仅仅是从理论上,这样,有助于更好地理解,然后,我们来看下get和put到底是怎样工作的. 我们来看个非常简单的例子.有一个”国家”(Country)类,我们将要用Country对象作为key,它的首都的名字(String类型)作为value.下面的例子有助于我们理解key-value对在HashMap中是如何存储的. 1. Country.java 1 2 3 4 5 6 7 8 9 10 11 12 13

那些年读过的书《Java并发编程的艺术》一、并发编程的挑战和并发机制的底层实现原理

一.并发编程的挑战 1.上下文切换 (1)上下文切换的问题 在处理器上提供了强大的并行性就使得程序的并发成为了可能.处理器通过给不同的线程分配不同的时间片以实现线程执行的自动调度和切换,实现了程序并行的假象. 在单线程中:线程保存串行的执行,线程间的上下文切换不会造成很大的性能开销. 而在多线程中:线程之间频繁的调度需要进行上下文切换以保存当前执行线程的上下文信息和加载将要执行线程的上下文信息,而上下文切换时需要底层处理器.操作系统.Java虚拟机提供支持的会消耗很多的性能开 销.如果频繁的进行

HashMap&amp;HashSet底层实现【转载】

1.    HashMap概述: HashMap是基于哈希表的Map接口的非同步实现.此实现提供所有可选的映射操作,并允许使用null值和null键.此类不保证映射的顺序,特别是它不保证该顺序恒久不变. 2.    HashMap的数据结构: 在java编程语言中,最基本的结构就是两种,一个是数组,另外一个是模拟指针(引用),所有的数据结构都可以用这两个基本结构来构造的,HashMap也不例外.HashMap实际上是一个“链表散列”的数据结构,即数组和链表的结合体. 从上图中可以看出,HashM