从语言设计的角度探究Java中hashCode()和equals()的关系

目录

  • 一. 基础: hashCode()和equals()简介
  • 二. 漫谈: 引入hashCode()与equals()之间的关系
  • 三. 解密: 深入理解hashCode()和equals()之间的关系.
  • 四. 验证: 结合HashMap的源码和官方文档, 验证两者的关系.

一. 基础: hashCode()和equals()简介

在学习hashCode()和equals()之间的关系之前, 我们有必要先单独了解他俩自身的特点.

  • equals()方法用于比较两个对象是否相等, 它与"=="相等比较符有着本质的不同. 在万物皆对象的Java体系中, 系统把判断对象是否相等的权力交给程序员, 具体的措施是把equals()方法写入到Object类中, 并让所有类继承Object类. 这样程序员就能在类中自定义equals()方法, 从而实现自己的业务逻辑.
  • 关于equals()和"=="的区别你可以--参考这篇文章--

?

  • hashCode()的意思是哈希值, 哈希值是哈希函数运算后得到的结果, 哈希函数能够保证相同的输入能够得到相同的输出(哈希值), 但是不能够保证不同的输入总是能得出不同的输出. 当输入的样本量足够大时, 是会产生哈希冲突的, 也就是不同的输入产生了相同的输出.
  • 暂且不谈冲突, 就相同的输入能够产生相同的输出这点而言, 是及其宝贵的. 它使得系统只需要通过简单的运算, 在时间复杂度O(1)的情况下就能得出数据的映射关系, 根据这种特性引申出了散列表这种数据结构.
  • 一种主流的散列表实现是: 用数组作为哈希函数的输出域, 输入值经过哈希函数计算后得到哈希值, 然后根据哈希值在数组种找到对应的存储单元. 当发生冲突时, 对应的存储单元以链表的形式保存冲突的数据.

?

二. 漫谈: 引入hashCode()与equals()之间的关系

下面我们从一个宏观的角度引入hashCode()和equals()之间的关系

  • 在大多数编程实践中, 归根结底会落实到数据的存取问题上. 在汇编语言时代, 你需要老老实实地对每个数据操作编写存取语句; 随着时代发展到今天, 我们都用类似Java这样的高级语言编写代码. Java除了拥有面向对象的核心思想外, 还给我们封装了一系列操作数据的api, 为编程工作提供了极大的便利.
  • 但在我们对数据进行操作之前, 首先要把数据按照一定的数据结构保存到存储单元中, 否则操作数据将无从谈起. 然而不同的数据结构有各自的特点, 我们在存储数据的时候需要选择适合自己的数据结构进行存储. Java根据不同的数据结构提供了丰富的容器类, 方便程序员选择适合业务的容器类进行开发.
  • 而Java的容器类被分为Collection和Map两大类, Collection又可以进一步分为List和Set. 其中Map和Set都是不允许元素重复的, 严格来说Map存储的是键值对, 它不允许重复的键值. 值得注意的是: Map和Set的绝大多数实现类的底层都会用到散列表结构.
  • 讲到这里我们提取两个关键字不允许重复散列表结构, 回顾hashCode()和equals()的特点, 你是否想到了些什么东西呢?

?

三. 解密: 深入理解hashCode()和equals()之间的关系.

  • 上面提到Set和Map不存放重复的元素(key), 那么在存储元素的时候就必须对元素做出判断: 在当前的容器中有没有和新元素相同的元素?.
  • 你可能会想: 这容易呀, 直接调用元素对象的equals()方法进行比较不就行了吗? 如果容器中的存储的对象数量较少, 这确实是个好主意, 但是如果容器中存放的对象达到了一定的规模, 要调用容器中所有对象的equals()方法和新元素进行比较就不是一件容易的事情了, 就算equals()方法的比较逻辑简单无比, 这也是一个时间复杂度为O(n)的操作啊.

?

  • 但在散列表的基础上判断"新对象是否和容器中任一对象相同"就容易得多了. 由于每个对象都自带有hashCode(), 这个hashCode将会用作散列表哈希函数的输入, hashCode经过哈希函数计算后得到哈希值, 新对象根据哈希值存储到相应的内存的单元.
  • 我们不妨假设两个相同的对象, hashCode()一定相同, 这么一来就体现出哈希函数的威力了, 由于相同的输入一定会产生相同的输出, 于是如果新对象和容器中已存在的对象相同, 新对象计算出的哈希值就会和已存在的对象的哈希值产生冲突, 这时容器就能判断: 这个新加入的元素已经存在, 需要另作处理(覆盖掉原来的元素(key)或舍弃).
  • 按照这个思路, 如果这个元素计算出的哈希值所对应的地址没有产生冲突, 也就是没有重复的元素, 那么它就可以直接插入. 所以当运用hashCode()时, 判断是否有相同元素的代价只是一次哈希计算, 时间复杂度为O(1), 这极大地提高了数据的存储性能.

?

  • 但是前面我们还提到: 当输入样本量足够大时, 不相同的输入是会产生相同输出的, 也就是形成哈希冲突. 这么一来就麻烦了, 原来我们设定的"如果产生冲突, 就意味着两个对象相同"的规则瞬间被打破, 产生冲突的很有可能是两个不同的对象!
  • 而令人欣慰的是我们除了hashCode()方法, 还有一张王牌: equals()方法. 也就是说当两个不相同的对象产生哈希冲突后, 我们可以用equals()方法进一步判断两个对象是否相同. 这时equals()方法就相当重要了, 这个情况下它必须要能判定这两个对象是不相同的.
  • 讲到这里就引出了Java程序设计中一些重要原则:
  • 如果两个对象是相等的, 它们的equals()方法应该要返回true, 它们的hashCode()需要返回相同的结果.
  • 但有时候面试题不会问得这么直接, 它会问你:两个对象的hashCdoe()相同, 它的equals()方法一定要返回true, 对吗?
  • 那答案肯定不对. 因为我们不能保证每个程序设计者都会遵循编码规则, 有可能两个不同对象的hashCode()会返回相同的结果. 如果你理解上面的内容, 这个问题就很好解答: 两个对象的hashCode()相同, 将来会在散列表中产生哈希冲突, 但是它们不一定是相同的对象呀. 当产生哈希冲突时, 我们还得通过equals()方法进一步判断两个对象是否相同, equals()方法不一定会返回true.
  • 这也是为什么Java官方推荐我们最好同时重写hashCode()和equals()方法的原因.

?

四. 验证: 结合HashMap的源码和官方文档, 验证两者的关系.

以上的文字是我经过思考后得出的, 它有一定依据但并非完全可靠, 下面我们根据HashMap的源码(JDK1.8)和官方文档来验证这些推论是否正确.

  • 通过阅读JDK8的官方文档, 我们发现equals()方法介绍的最后有这么一段话:

    Note that it is generally necessary to override the hashCode method whenever this method is overridden, so as to maintain the general contract for the hashCode method, which states that equal objects must have equal hash codes.

  • 官方文档提醒我们当重写equals方法的时候, 最好也要重写hashCode()方法. 也就是说如果我们通过重写equals方法判断两个对象相同时, 他们的hash code也应该相同, 这样才能让hashCode()方法发挥它的作用.
  • 那它究竟能发会怎样的作用呢? 我们结合部分较为常用的HashMap源码进一步分析. (像HashSet底层也是通过HashMap实现)
  • 在HashMap中用得最多无疑是put()方法了, 以下是put()的源码:
public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}
  • 我们可以看到put()方法实际调用的是putVal()方法, 继续跟进:
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    //在我们创建HashMap对象的时候, 内存中并没有为HashMap分配表的空间, 直到往HashMap中put添加元素的时候才调用resize()方法初始化表
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;//同时确定了表的长度

    //((n - 1) & hash)确定了要put的元素的位置, 如果要插入的地方是空的, 就可以直接插入.
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {//如果发生了冲突, 就要在冲突位置的链表末尾插入元素
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            //关键!!!当判断新加入的元素是否与已有的元素相同, 首先判断的是hash值, 后面再调用equals()方法. 如果hash值不同是直接跳过的
            e = p;
        else if (p instanceof TreeNode)//如果冲突解决方案已经变成红黑树的话, 按红黑树的策略添加结点.
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {//解决冲突的方式仍是链表
            for (int binCount = 0; ; ++binCount) {//找到链表的末尾, 插入.
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);//插入之后要判断链表的长度, 如果到达一定的值就可能要转换为红黑树.
                    break;
                }//在遍历的过程中仍会不停地判定当前key是否与传入的key相同, 判断的第一条件仍然是hash值.
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;//修改map的次数增加
    if (++size > threshold)//如果hashMap的容量到达了一定值就要进行扩容
        resize();
    afterNodeInsertion(evict);
    return null;
}
  • 我们可以看到每当判断key是否相同的是否, 首先会判断hash值, 如果hash值相同(产生了冲突), 然后会判断key引用所指的对象是否相同, 最终会通过equals()方法作最后的判定.
  • 如果key的hash值不同, 后面的判断将不会执行, 直接认定两个对象不相同.
if (p.hash == hash &&
    ((k = p.key) == key || (key != null && key.equals(k))))
    e = p;

结束

  • 讲到这里希望大家对hashCode()与equals()方法能有更深入的理解, 明白背后的设计思想与原理.
  • 我之前有一个疑问, 可能大家看完这篇文章后也会有: equals()方法平时我会用到, 所以我知道它除了和hashCode()方法有密切联系外, 还有别的用途. 但是hashCode()呢, 它除了和equals()方法有密切联系外, 还有其他用途吗?
  • 经过在互联网上一番搜寻, 我目前给出的答案是没有. 也就是说hashCode()仅在散列表中才有用,在其它情况下没用.
  • 当然如果这个答案不正确, 或者你还有别的思考, 欢迎留言与我交流~


?

  • 最后欢迎关注我的免费知识星球, 我会在星球中持续更新系统的Java后端面试题分析, 将会囊括Java基础知识到主流框架原理. 还会分享关于编程的趣味漫画.

原文地址:https://www.cnblogs.com/tanshaoshenghao/p/10915055.html

时间: 2024-11-05 22:07:55

从语言设计的角度探究Java中hashCode()和equals()的关系的相关文章

面试点:Java 中 hashCode() 和 equals() 的关系

Java 中 hashCode() 和 equals() 的关系是面试中的常考点,如果没有深入思考过两者设计的初衷,这个问题将很难回答.除了应付面试,理解二者的关系更有助于我们写出高质量且准确的代码. 一.基础:hashCode() 和 equals() 简介 在学习 hashCode() 和 equals() 之间的关系之前, 我们有必要先单独地了解他俩的特点. equals() equals() 方法用于比较两个对象是否相等,它与 == 相等比较符有着本质的不同. 在万物皆对象的 Java

java 中hashcode和equals 总结

一.概述            在Java中hashCode的实现总是伴随着equals,他们是紧密配合的,你要是自己设计了其中一个,就要设计另外一个.当然在多数情况下,这两个方法是不用我们考虑的,直接使用默认方法就可以帮助我们解决很多问题.但是在有些情况,我们必须要自己动手来实现它,才能确保程序更好的运作. 1.1 规则 粗略总结一下在JavaDoc中所规定hashcode方法的合约:      Objects that are equal must have the same hash co

Java中hashcode,equals和==

hashcode方法返回该对象的哈希码值. hashCode()方法可以用来来提高Map里面的搜索效率的,Map会根据不同的hashCode()来放在不同的位置,Map在搜索一个对象的时候先通过hashCode()找到相应的位置,然后再根据equals()方法判断这个位置上的对象与当前要插入的对象是不是同一个.若两个对象equals相等,但不在一个区间,根本没有机会进行比较,会被认为是不同的对象. 所以,Java对于eqauls方法和hashCode方法是这样规定的: 1.如果两个对象相同,那么

java中hashcode()和equals()的详解

今天下午研究了半天hashcode()和equals()方法,终于有了一点点的明白,写下来与大家分享(zhaoxudong 2008.10.23晚21.36). 1. 首先equals()和hashcode()这两个方法都是从object类中继承过来的. equals()方法在object类中定义如下: public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较(即比较引用是否相同).但是我们必需清

java中hashcode()和equals()的详解 (转)

(zhaoxudong 2008.10.23晚21.36). 1. 首先equals()和hashcode()这两个方法都是从object类中继承过来的. equals()方法在object类中定义如下:   public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较(即比较引用是否相同).但是我们必需清楚,当String .Math.还有Integer.Double....等这些封装类在使用equ

Java 中 hashCode 和 equals 方法 小结

转载:http://www.oschina.net/question/82993_75533 hashCode()和equals()定义在Object类中,这个类是所有java类的基类,所以所有的java类都继承这两个方法. hashcode主要是set集合使用,是用于判断对象是否”可能“相等的快捷办法,以解决大集合的问题.举例来说,如果一个一万个元素的集合加入一个元素,如果是一个新元素,那么必须要equal一万次才能加入.所以采用hashcode,hashcode的思路是如果equal,则ha

java中hashcode和equals的区别和联系

HashSet和HashMap一直都是JDK中最常用的两个类,HashSet要求不能存储相同的对象,HashMap要求不能存储相同的键. 那么Java运行时环境是如何判断HashSet中相同对象.HashMap中相同键的呢?当存储了“相同的东西”之后Java运行时环境又将如何来维护呢? 在研究这个问题之前,首先说明一下JDK对equals(Object obj)和hashcode()这两个方法的定义和规范: 在Java中任何一个对象都具备equals(Object obj)和hashcode()

探究Java中的引用

探究Java中的四种引用 从JDK1.2版本开始,Java把对象的引用分为四种级别,从而使程序能更加灵活的控制对象的生命周期.这四种级别由高到低依次为:强引用.软引用.弱引用和虚引用.本篇就来详细探究一下这四种引用的机制: 强引用 软引用 弱引用 虚引用 详解ReferenceQueue与Reference 强引用 强引用是最普遍的引用,一般通过new关键字来创建出来的对象引用都属于强引用,比如Object o = new Object(). 如果一个对象具有强引用,它就不会被垃圾回收器回收.即

探究Java中Map类

Map以按键/数值对的形式存储数据,和数组非常相似,在数组中存在的索引,它们本身也是对象.       Map的接口       Map---实现Map       Map.Entry--Map的内部类,描述Map中的按键/数值对.       SortedMap---扩展Map,使按键保持升序排列           关于怎么使用,一般是选择Map的子类,而不直接用Map类.       下面以HashMap为例.       public     static     void     ma