结合java.util.TreeMap源码理解红黑树

前言

本篇将结合JDK1.6的TreeMap源码,来一起探索红-黑树的奥秘。红黑树是解决二叉搜索树的非平衡问题。

当插入(或者删除)一个新节点时,为了使树保持平衡,必须遵循一定的规则,这个规则就是红-黑规则: 
1) 每个节点不是红色的就是黑色的 
2) 根总是黑色的 
3) 如果节点是红色的,则它的子节点必须是黑色的(反之倒不一定必须为真) 
4) 从跟到叶节点或者空子节点的每条路径,必须包含相同数目的黑色节点

插入一个新节点

红-黑树的插入过程和普通的二叉搜索树基本一致:从跟朝插入点位置走,在每个节点处通过比较节点的关键字相对大小来决定向左走还是向右走。

public V put(K key, V value) {
    Entry<K,V> t = root;
    int cmp;
    Entry<K,V> parent;
    Comparable<? super K> k = (Comparable<? super K>) key;
    do {
        parent = t;
        cmp = k.compareTo(t.key);
        if (cmp < 0) {
            t = t.left;
        } else if (cmp > 0) {
            t = t.right;
        } else {
            // 注意,return退出方法
            return t.setValue(value);
        }
    } while (t != null);
    Entry<K,V> e = new Entry<K,V>(key, value, parent);
    if (cmp < 0) {
        parent.left = e;
    } else {
        parent.right = e;
    }
    fixAfterInsertion(e);
    size++;
    modCount++;
    return null;
}

但是,在红-黑树种,找到插入点更复杂,因为有颜色变换和旋转。fixAfterInsertion()方法就是处理颜色变换和旋转,需重点掌握它是如何保持树的平衡(use rotations and the color rules to maintain the tree’s balance)。

下面的讨论中,使用X、P、G表示关联的节点。X表示一个特殊的节点, P是X的父,G是P的父。

X is a node that has caused a rule violation. (Sometimes X refers to a newly inserted node, and sometimes to the child node when a parent and child have a redred conflict.)

On the way down the tree to find the insertion point, you perform a color flip whenever you find a black node with two red children (a violation of Rule 2). Sometimes the flip causes a red-red conflict (a violation of Rule 3). Call the red child X and the red parent P. The conflict can be fixed with a single rotation or a double rotation, depending on whether X is an outside or inside grandchild of G. Following color flips and rotations, you continue down to the insertion point and insert the new node.

After you’ve inserted the new node X, if P is black, you simply attach the new red node. If P is red, there are two possibilities: X can be an outside or inside grandchild of G. If X is an outside grandchild, you perform one rotation, and if it’s an inside grandchild, you perform two. This restores the tree to a balanced state.

按照上面的解释,讨论可分为3个部分,按复杂程度排列,分别是: 
1) 在下行路途中的颜色变换(Color flips on the way down) 
2) 插入节点之后的旋转(Rotations after the node is inserted) 
3) 在向下路途上的旋转(Rotations on the way down)

在下行路途中的颜色变换(Color flips on the way down)

Here’s the rule: Every time the insertion routine encounters a black node that has two red children, it must change the children to black and the parent to red (unless the parent is the root, which always remains black)

The flip leaves unchanged the number of black nodes on the path from the root on down through P to the leaf or null nodes.

尽管颜色变换不会违背规则4,但是可能会违背规则3。如果P的父是黑色的,则P由黑色变成红色时不会有任何问题,但是,如果P的父是红色的,那么在P的颜色变化之后,就有两个红色节点相连接了。这个问题需要在继续向下沿着路径插入新节点之前解决,可以通过旋转修正这个问题,下文将会看到。

插入节点之后的旋转(Rotations after the node is inserted)

新节点在插入之前,树是符合红-黑规则,在插入新节点之后,树就不平衡了,此时需要通过旋转来调整树的平衡,使之重新符合红-黑规则。

可能性1:P是黑色的,就什么事情也不用做。插入即可。

可能性2:P是红色,X是G的一个外侧子孙节点,则需要一次旋转和一些颜色的变化。 
以插入50,25,75,12,6为例,注意节点6是一个外侧子孙节点,它和它的父节点都是红色。

在这个例子中,X是一个外侧子孙节点而且是左子节点,X是外侧子孙节点且为右子节点,是一种与此对称的情况。通过用50,25,75,87,93创建树,同理再画一画图,这里就省略了。

可能性3:P是红色,X是G的一个内侧子孙节点,则需要两次旋转和一些颜色的改变。 
以插入50,25,75,12,18为例,注意节点18是一个内侧子孙节点,它和它的父节点都是红色。

在向下路途上的旋转(Rotations on the way down)

在插入新节点之前,实际上树已经违背了红-黑规则,所以需要插入新节点之前做调整。所以我们本次讨论的主题是“在向下路途准备插入新节点时,上面先进行调整,使上面成为标准的红黑树后,再进行新节点插入”。

外侧子孙节点

以插入50,25,75,12,37,6,18,3为例,例子中违背规则的节点是一个外侧子孙节点。

内侧子孙节点

以插入50,25,75,12,37,31,43为例,例子中违背规则的节点是一个内侧子孙节点。

红-黑树的效率

和一般的二叉搜索树类似,红-黑树的查找、插入和删除的时间复杂度为O(log2N)。

红-黑树的查找时间和普通的二叉搜索树的查找时间应该几乎完全一样。因为在查找过程中并没用到红-黑特征。额外的开销只是每个节点的存储空间都稍微增加了一点,来存储红黑颜色(一个boolean变量)。

final Entry<K, V> getEntry(Object key) {
    Comparable <? super K > k = (Comparable <? super K > ) key;
    Entry<K, V> p = root;
    while (p != null) {
        int cmp = k.compareTo(p.key);
        if (cmp < 0) {
            p = p.left;
        } else if (cmp > 0) {
            p = p.right;
        } else  {
            return p;
        }
    }
    return null;
}

插入和删除的时间要增加一个常数因子,因为不得不在下行的路径上和插入点执行颜色变换和旋转。平均起来一次插入大约需要一次旋转。

因为在大多数应用中,查找的次数比插入和删除的次数多,所以应用红-黑树取代普通的二叉搜索树总体上不会增加太多的时间开销。

参考资料

  1. eclipse如何debug调试jdk源码
  2. 浅谈算法和数据结构: 九 平衡查找树之红黑树
时间: 2024-07-28 19:58:43

结合java.util.TreeMap源码理解红黑树的相关文章

java.util.TreeMap源码分析

TreeMap的实现基于红黑树,排列的顺序根据key的大小,或者在创建时提供的比较器,取决于使用哪个构造器. 对于,containsKey,get,put,remove操作,保证时间复杂度为log(n). TreeMap的顺序与equals方法保持一致,这样才能遵守Map和SortMap的约定. 实现非同步,运行在多线程环境下,要进行外部同步,或者调用SortedMap m = Collections.synchronizedSortedMap(new TreeMap(...));方法得到一个同

Java - HashTree源码解析 + 红黑树

Java提高篇(二七)-----TreeMap TreeMap的实现是红黑树算法的实现,所以要了解TreeMap就必须对红黑树有一定的了解,其实这篇博文的名字叫做:根据红黑树的算法来分析TreeMap的实现,但是为了与Java提高篇系列博文保持一致还是叫做TreeMap比较好.通过这篇博文你可以获得如下知识点: 1.红黑树的基本概念. 2.红黑树增加节点.删除节点的实现过程. 3.红黑树左旋转.右旋转的复杂过程. 4.Java 中TreeMap是如何通过put.deleteEntry两个来实现红

jdk源码分析红黑树——插入篇

红黑树是自平衡的排序树,自平衡的优点是减少遍历的节点,所以效率会高.如果是非平衡的二叉树,当顺序或逆序插入的时候,查找动作很可能会遍历n个节点 红黑树的规则很容易理解,但是维护这个规则难. 一.规则 1.每个节点要么是红色.要么是黑色 2.根节点一定是黑色 3.红色节点不可以连续出现(父节点.子节点不可同时为红) 4.从任意节点出发,到树底的所有路线,途径的黑节点数量必须相同 在修改红黑树的时候,切记要维护这个规则.一般默认插入红色节点(除非是root节点),插入后再进行旋转和颜色变换 二.旋转

java.util.Objects 源码学习

Objects 与 Object 区别 Object 是 Java 中所有类的基类,位于java.lang包. Objects 是 Object 的工具类,位于java.util包.它从jdk1.7开始才出现,被final修饰不能被继承,拥有私有的构造函数. 它由一些静态的实用方法组成,这些方法是null-save(空指针安全的)或null-tolerant(容忍空指针的),用于计算对象的hashcode.返回对象的字符串表示形式.比较两个对象. Objects 各方法介绍与分析 equals

java.util.AbstractStringBuilder源码分析

AbstractStringBuilder是一个抽象类,是StringBuilder和StringBuffer的父类,分析它的源码对StringBuilder和StringBuffer代码的理解有很大的帮助. 先来看看该类的声明: abstract class AbstractStringBuilder implements Appendable, CharSequence {} 该类实现Appendable和CharSequence接口. 成员变量: char[] value;//字符数组用来

java.util.HashMap源码浅析之解决hash冲突

HashMap是java无论是企业管理系统还是web或者其他应用层的程序开发,都是应用比较多的一种数据结构,正好最近面试有问到与HashMap解决hash冲突的方式(本人菜比没答上来),现浅析源码以解惑 且记录,将来在项目上尽量避免此类问题的出现,大家都知道HashMap为key-value存储,在HashMap中,HashMap本身拥有一个Entry数组,Entry则存有key-value,且对于Hashmap来讲一个key只能对应一个value     首先是put方法          

java.util.TreeSet源码分析

public class TreeSet<E> extends AbstractSet<E> implements NavigableSet<E>, Cloneable, java.io.Serializable TreeSet的实现基于TreeMap,元素的顺序取决于元素自然顺序或者在被创建出来时提供的比较器. 对于基本操作,add.remove.contains的时间复杂度为logn. 不是线程安全的,如果在多线程环境下,必须被同步化,可通过一个object作为锁来

java.util.Map源码分析

/** * An object that maps keys to values. A map cannot contain duplicate keys; * each key can map to at most one value. * * <p>This interface takes the place of the <tt>Dictionary</tt> class, which * was a totally abstract class rather t

java.util.ArrayList源码分析

public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable 可变数组大小的List实现,允许所有的元素,包括null.(该类可粗略地看作是Vector,除了它不是同步化的) size.isEmpty.get.set.iterator和listIterator操作的运行时间是常量.add操作对于添加n个