HashMap/HashSet,hashCode,哈希表

　　HashMap实现了Map接口，该接口的作用主要是为客户提供三种方式的数据显示：只查看keys列表；只查看values列表，或以key-value形式成对查看。Map接口并没有定义数据要如何存储，也没有指定如何判定key是一样，因此并不是所有的Map实现都会与hashCode方法扯上关系，如TreeMap便是要求对象实现Comparator接口，通过其compare方法来比对两者是否一致，而非hashCode及equals。同理，如果我们自己实现Map接口，我们也可以直接使用数组进行数据存储使用==判定key值是否一致，依然可以完全满足Map接口的定义。

就是一个键值对应的集合，包含put，get,equals,hashCode

HashMap a = new HashMap();　　a.put("name", "abcdef"); // key是name，value是字符串abcdefHashMap是基于HashCode的

Hash容器的基本要求应该有如下几点：

满足Hash表的查找要求（废话）
能支持从小数据量到大数据量的自动转变（自动扩容）
使用挂链法解决冲突

在Hash表中，记录在表中的位置和其关键字之间存在着一种确定的关系。这样我们就能预先知道所查关键字在表中的位置，从而直接通过下标找到记录。

HashSet无序，不可重复，线程非同步。底层是哈希表结构

散列表（Hash table，也叫哈希表），是根据关键字(Key value)而直接进行访问的数据结构。
也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。

HashMap底层就是散列表数据结构，即数组和链表的结合体，
底层是一个数组结构，数组中的每一项又是一个链表。这样做有什么好处呢？
数组能够提供对元素的快速访问但不易于扩展(如果不知道元素脚标，还得进行遍历查找)，链表易于扩展但不能对其元素进行快速访问。
怎样做到两全其美，就是散列表数据结构

元素(key,value)在HashMap中被封装进Entry数组。
put元素的时候，根据key的hash值定位元素在Entry数组中的索引，如果当前索引有元素，就通过equals方法进行比较，将元素存进当前Entry的链表中适当的位置。
get元素的时候，根据key的hash值定位元素在Entry数组中的索引，然后通过equals方法定位元素在链表中的位置，取出该元素。

性能分析：

因为元素的存取是通过hash算法进行的，所以速度都没的说。
在查找操作中，唯一影响性能的是在链表中，但实际只要优化好了key对象hashCode跟equals方法，就会避免链表中的数据过多而导致查找性能变慢。

hashcode方法返回该对象的哈希码值。支持该方法是为哈希表提供一些优点，例如，java.util.Hashtable 提供的哈希表。
hashCode 的常规协定是：
在 Java 应用程序执行期间，在同一对象上多次调用 hashCode 方法时，必须一致地返回相同的整数，前提是对象上 equals 比较中所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行，该整数无需保持一致。
如果根据 equals(Object) 方法，两个对象是相等的，那么在两个对象中的每个对象上调用 hashCode 方法都必须生成相同的整数结果。
以下情况不是必需的：如果根据 equals(java.lang.Object) 方法，两个对象不相等，那么在两个对象中的任一对象上调用 hashCode 方法必定会生成不同的整数结果。但是，程序员应该知道，为不相等的对象生成不同整数结果可以提高哈希表的性能。
实际上，由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。（这一般是通过将该对象的内部地址转换成一个整数来实现的，但是 JavaTM 编程语言不需要这种实现技巧。）
当equals方法被重写时，通常有必要重写 hashCode 方法，以维护 hashCode 方法的常规协定，该协定声明相等对象必须具有相等的哈希码。

1.hashcode是用来查找的，如果你学过数据结构就应该知道，在查找和排序这一章有
例如内存中有这样的位置
0 1 2 3 4 5 6 7
而我有个类，这个类有个字段叫ID,我要把这个类存放在以上8个位置之一，如果不用hashcode而任意存放，那么当查找时就需要到这八个位置里挨个去找，或者用二分法一类的算法。
但如果用hashcode那就会使效率提高很多。
我们这个类中有个字段叫ID,那么我们就定义我们的hashcode为ID％8，然后把我们的类存放在取得得余数那个位置。比如我们的ID为9，9除8的余数为1，那么我们就把该类存在1这个位置，如果ID是13，求得的余数是5，那么我们就把该类放在5这个位置。这样，以后在查找该类时就可以通过ID除 8求余数直接找到存放的位置了。
2.但是如果两个类有相同的hashcode怎么办那（我们假设上面的类的ID不是唯一的），例如9除以8和17除以8的余数都是1，那么这是不是合法的，回答是：可以这样。那么如何判断呢？在这个时候就需要定义 equals了。
也就是说，我们先通过 hashcode来判断两个类是否存放某个桶里，但这个桶里可能有很多类，那么我们就需要再通过 equals 来在这个桶里找到我们要的类。
那么。重写了equals()，为什么还要重写hashCode()呢？
想想，你要在一个桶里找东西，你必须先要找到这个桶啊，你不通过重写hashcode()来找到桶，光重写equals()有什么用啊

哈希算法也称为散列算法，是将数据依特定算法直接指定到一个地址上。如果详细讲解哈希算法，那需要更多的文章篇幅，我在这里就不介绍了。
初学者可以这样理解，hashCode方法实际上返回的就是对象存储的物理地址（实际可能并不是）。
这样一来，当集合要添加新的元素时，先调用这个元素的hashCode方法，就一下子能定位到它应该放置的物理位置上。
如果这个位置上没有元素，它就可以直接存储在这个位置上，不用再进行任何比较了；如果这个位置上已经有元素了，
就调用它的equals方法与新元素进行比较，相同的话就不存了，不相同就散列其它的地址。
所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了，几乎只需要一两次。
所以，Java对于eqauls方法和hashCode方法是这样规定的：
1、如果两个对象相同，那么它们的hashCode值一定要相同；2、如果两个对象的hashCode相同，它们并不一定相同     上面说的对象相同指的是用eqauls方法比较。
你当然可以不按要求去做了，但你会发现，相同的对象可以出现在Set集合中。同时，增加新元素的效率会大大下降。

Java中的集合（Collection）有两类，一类是List，再有一类是Set。
你知道它们的区别吗？前者集合内的元素是有序的，元素可以重复；后者元素无序，但元素不可重复。
那么这里就有一个比较严重的问题了：要想保证元素不重复，可两个元素是否重复应该依据什么来判断呢？
这就是Object.equals方法了。但是，如果每增加一个元素就检查一次，那么当元素很多时，后添加到集合中的元素比较的次数就非常多了。

hashcode这个方法是用来鉴定2个对象是否相等的。那你会说，不是还有equals这个方法吗？

不错，这2个方法都是用来判断2个对象是否相等的。但是他们是有区别的。

一般来讲，equals这个方法是给用户调用的，如果你想判断2个对象是否相等，你可以重写equals方法，然后在代码中调用，就可以判断他们是否相等了。简单来讲，equals方法主要是用来判断从表面上看或者从内容上看，2个对象是不是相等。举个例子，有个学生类，属性只有姓名和性别，那么我们可以认为只要姓名和性别相等，那么就说这2个对象是相等的。

hashcode方法一般用户不会去调用，比如在hashmap中，由于key是不可以重复的，他在判断key是不是重复的时候就判断了hashcode这个方法，而且也用到了equals方法。这里不可以重复是说equals和hashcode只要有一个不等就可以了！所以简单来讲，hashcode相当于是一个对象的编码，就好像文件中的md5，他和equals不同就在于他返回的是int型的，比较起来不直观。我们一般在覆盖equals的同时也要覆盖hashcode，让他们的逻辑一致。举个例子，还是刚刚的例子，如果姓名和性别相等就算2个对象相等的话，那么hashcode的方法也要返回姓名的hashcode值加上性别的hashcode值，这样从逻辑上，他们就一致了。

要从物理上判断2个对象是否相等，用==就可以了。

1.hashMap去掉了HashTable 的contains方法，但是加上了containsValue（）和containsKey（）方法。

2.hashTable同步的，线程安全，而HashMap是非同步的，线程不安全，效率上逼hashTable要高。

3.hashMap允许空键值，而hashTable不允许。

4.HashTable中hash数组默认大小是11，增加的方式是 old*2+1。HashMap中hash数组的默认大小是16，而且一定是2的指数。

5.Hashtable是Dictionary的子类，HashMap是Map接口的一个实现类；

HashMap实现同步的方法：调用Collections的静态方法Collections.synchronizedMap(Map map);，返回一个同步的Map，这个Map封装了底层的HashMap的所有方法，使得底层的HashMap即使是在多线程的环境中也是安全的。

同时说一下，ArrayList和HashSet，他们也都不是同步的，都是线程不安全的，对其实现同步的方式和HashMap的方式相同，都允许使用null元素，ArrayList分配的初始空间为10，HashSet分配的初始空间为16

时间： 2024-11-10 18:30:37

HashMap/HashSet,hashCode,哈希表

HashMap/HashSet,hashCode,哈希表的相关文章

48 容器（七）——HashMap底层：哈希表结构与哈希算法

HashMap&HashSet底层实现【转载】

深入Java基础（四）--哈希表（1）HashMap应用及源码详解

哈希表（HashMap)分析及实现(JAVA)

哈希表在Java类库中的实现——HashSet

Java List集合和哈希表

Code Review:C#与JAVA的哈希表内部机制的一些区别

java 散列与散列码探讨 ,简单HashMap实现散列映射表执行各种操作示列

算法6-4：哈希表现状