转载:http://www.oschina.net/question/82993_75533
hashCode()和equals()定义在Object类中,这个类是所有java类的基类,所以所有的java类都继承这两个方法。
hashcode主要是set集合使用,是用于判断对象是否”可能“相等的快捷办法,以解决大集合的问题。举例来说,如果一个一万个元素的集合加入一个元素,如果是一个新元素,那么必须要equal一万次才能加入。所以采用hashcode,hashcode的思路是如果equal,则hashcode一定要相等,反过来则不一定;所以如果hashcode不相等,那么一定不equal,这跟md5的hash来判别密码是一个道理。hashcode用64位整数,这样可以建立一个索引,新加入元素,先判断这个新元素的hashcode是否存在,如果不存在,肯定不相等,加入set中;如果存在,则与已有的hashcode的若干个元素比较,这样大大简化了set的equal操作。
使用hashCode()和equals()
hashCode()方法被用来获取给定对象的唯一整数。这个整数被用来确定对象被存储在HashTable类似的结构中的位置。默认的,Object类的hashCode()方法返回这个对象存储的内存地址的编号。
重写默认的实现
如果你不重写这两个方法,将几乎不遇到任何问题,但是有的时候程序要求我们必须改变一些对象的默认实现。
来看看这个例子,让我们创建一个简单的类Employee
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 |
|
上面的Employee类只是有一些非常基础的属性和getter、setter.现在来考虑一个你需要比较两个employee的情形。
1 2 3 4 5 6 7 8 9 10 11 |
|
毫无疑问,上面的程序将输出false,但是,事实上上面两个对象代表的是通过一个employee。真正的商业逻辑希望我们返回true。
为了达到这个目的,我们需要重写equals方法。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|
在上面的类中添加这个方法,EauqlsTest将会输出true。
So are we done?没有,让我们换一种测试方法来看看。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
|
上面的程序输出的结果是两个。如果两个employee对象equals返回true,Set中应该只存储一个对象才对,问题在哪里呢?
我们忘掉了第二个重要的方法hashCode()。就像JDK的Javadoc中所说的一样,如果重写equals()方法必须要重写hashCode()方法。我们加上下面这个方法,程序将执行正确。
(大概意思是说31这个值是一个奇素数,只是一个默认的传统。并不一定要用31。但是这个数可以通过位移的方式来处理乘法,获得一些性能上的优化。虚拟机会自动做这些优化。)
1 2 3 4 5 6 7 8 |
|
hash散列算法,使得在hash表中查找一个记录速度变O(1). 每个记录都有自己的hashcode,散列算法按照hashcode把记录放置在合适的位置. 在查找一个记录,首先先通过hashcode快速定位记录的位置.然后再通过equals来比较是否相等. 没有hashcode,一个一个比较过来,时间就变O(N)了.
hashCode()方法要求:
当对象状态未改变,那么多次调用返回的值必须相等
两个对象equal,那么对象调用返回的值必须相等
equals方法的使用者是我们,而hashcode方法是jdk(如往list中插入值,会根据code决定顺序,这是equals方法无法代替的)。整体来说,equals相等,那么hashcode必须一样。而hashcode一样,equals不一定一样。
如果两个对象==,那么一定equal,然后一定要hashcode相等。而默认的实现是三个方法都采用了比较地址的方法,也就是三个其实都是等价的。所以,改写了equal,扩大了equal的情况范围,那么必须要同步扩大hashcode的相等范围,以维持”==则equal,equal则hashcode相等“的逻辑。
==是指的同一个的对象的2个不同的引用比较,在内存中指的是同一个地址。