转载:
总的来说,Java中的集合(Collection)有两类,一类是List,再有一类是Set。前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不可重复。那么这里就有一个比较严重的问题了:要想保证元素不重复,可两个元素是否重复应该依据什么来判断呢?这就是Object.equals方法了。但是,如果每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。也就是说,如果集合中现在已经有1000个元素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。
于是,Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上。如果详细讲解哈希算法,那需要更多的文章篇幅,我在这里就不介绍了。初学者可以这样理解,hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是)。
这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了,就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。 所以,Java对于eqauls方法和hashCode方法是这样规定的:
1、如果两个对象相同,那么它们的hashCode值一定要相同;
2、如果两个对象的hashCode相同,它们并不一定相同 上面说的对象相同指的是用eqauls方法比较。
hashcode的作用
Object类中的一个公有方法是public int hashCode() ,会返回当前对象的hashcode值(Object类中的该方法返回的是内存地址)一般情况下在涉及到某些集合类如hashMap、hashSet等情况下,需要重写hashCode()方法。
继承自Set的集合类不允许出现相同的元素,故而执行add操作时就需要检测集合中是否已经存在相同的元素,如果从头至尾依次执行equals方法,效率会很低下;故而这里重写了hashCode()方法,add操作执行时先比较是否存在相等的hashcode,如果存在则再执行equals操作,确定是否存在相等的元素,这样就提高了效率。
这里有个很形象的比喻:
hashcode是如何应用的
看一下HashMap的hashCode方法:
public final int hashCode() { return Objects.hashCode(getKey()) ^ Objects.hashCode(getValue()); }
Objects中:
/** * Returns the hash code of a non-{@code null} argument and 0 for * a {@code null} argument. * * @param o an object * @return the hash code of a non-{@code null} argument and 0 for * a {@code null} argument * @see Object#hashCode */ public static int hashCode(Object o) { return o != null ? o.hashCode() : 0; }
再贴一篇关于在自定义类中重写hashCode()方法前后的差异:
http://blog.csdn.net/woshixuye/article/details/8189398
hash算法:
https://www.zhihu.com/question/20820286
哈希算法,的含义要比hashMap等结合类中hashCode()的实现方式要广泛很多。,参见上面的链接。
http://zha-zi.iteye.com/blog/1124484
hashMap的实现原理