红黑树简介
红黑树是一种自平衡二叉查找树,也有着二叉搜索树的特性,保持着右边始终大于左边结点key的特性。前面提到过的AVL树,也是二叉搜索树的一种变形,红黑树没有达到AVL树的高度平衡,换句话说,它的高度,并没有AVL树那么高的要求,但他的应用却更加的广泛,实践中是相当高效的,他可以在O(log n)的时间内做查找、插入、删除操作。在C++ STL中,set、multiset、map、multimap等都应用到的红黑树的变体。
红黑树在平衡二叉搜索树的前提下,每个节点新增了 _color 这一成员变量,用来对各个节点做出标记。接下来,我们就来分析红黑树的插入算法。
一棵AVL树,需要满足以下几条要求。
1、每个结点,不是黑色就是红色
2、树的根结点必须是黑色
3、从根节点到叶子结点的任意一条路上,不允许存在两个连续的红色结点。
4、对于每个结点,从他开始到每个叶结点的简单路径上,黑色结点树相同。
这里多说一点,如果满足以上条件的话,从根节点开始,到叶子结点,最长的不会超过最长路径的两倍。(可以考虑最为极端的情况)
思路简析
和AVL树相同,要保证树的平衡性,必须要用到的是旋转算法。由于红黑树的情况比较多(尽管写起代码来不是很复杂),所以在这里旋转的过程中,我们不像AVL树一样,旋转的同时对平衡因子进行调整,红黑树的旋转算法,只是单纯调整当前结点与其parent 、grandparent 、uncle结点的相对位置,在旋转完成之后,我们再对结点颜色进行设置。
插入算法会在下面给出。
首先我们给出结点的定义。
enum Color{RED,BLACK};template<typename K, typename V>struct RBTreeNode{RBTreeNode<K, V>* _left;RBTreeNode<K, V>* _right;RBTreeNode<K, V>* _parent;K _key;V _value;Color _color;RBTreeNode(const K& key,const V& value):_left(NULL), _right(NULL), _parent(NULL), _key(key), _value(value), _color(RED)//默认构造红色结点{}};
_key为关键码(_key值是不允许重复的),_value为值,关于这里结点的构造函数,想多说一点,为什么结点颜色要默认给红色?很明显,一般情况下,黑色结点比红色结点多,但这里我们需要注意的是,我们针对的调整,其实大多数是红色。黑色结点下如果追加了红色结点,是不需要调整的,红色结点下如果多增加了一个黑色结点,是一定要进行调整的。
接下来开始插入结点。
1、处理特殊情况
当树为空树时,直接 new 一个结点给根,然后再改变颜色即可。
if (_root == NULL) { _root = new Node(key, value); _root->_color = BLACK; return true; }
2、树不为空树时,我们首先需要找到我们待插入结点的位置。由于红黑树是二叉搜索树,通过循环,比较待插入结点的key值和当前结点的大小,找到待插入结点的位置。同时给该节点开辟空间,确定和parent节点的指向关系。
Node* cur = _root; Node* parent = NULL; while (cur != NULL) { if (key > cur->_key) { parent = cur; cur = cur->_right; } else if (key < cur->_key) { parent = cur; cur = cur->_left; } else { return false; } } cur = new Node(key, value); if (key > (parent->_key)) { parent->_right = cur; cur->_parent = parent; } else { parent->_left = cur; cur->_parent = parent; }
当插入结点的parent结点为黑色结点时,不需要做任何调整,只需要和parent结点建立联系即可。
3、下面是需要我们特殊处理的几种情况。
我们给出四个Node结点 cur(待插入结点)、parent (cur的父亲结点)、grandparent(cur的祖父结点)、uncle(cur的叔叔结点)。
情况一、
parent为黑色,uncle存在且为红色
如图:
三角形结点只是表示可能存在的结点,可能为空。
当cur为新插入结点时,a-e结点均为空结点,由于不可以存在连续的红结点,因此,我们需要将parent结点和uncle结点变为黑色。细心的话可以发现,grandparent结点变为了红色,这是因为当grandparent不为根节点时,我们这棵子树的一条支路上的黑色结点就会多出一个,因此我们需要将grandparent结点变为红色,然后继续向上进行调整。在插入完成之后,我们只需要统一将根节点重新赋值为红色即可。
情况二、
parent为红色,uncle结点不存在,或uncle结点存在,但为黑色
如图:
看到第一张图的时候,不要怀疑这里画的有问题,这种情况是可能存在的,那就是说,cur是调整上来的,从我的上一种情况调整过来的,虽然看着grandparent的左右支路黑色结点数不相同,但我还有下面的三角形结点。
现在我这里就需要进行旋转,为什么这里不能直接颜色变换?因为我们抛过三角形结点,以grandparent结点为分界,最左支路和最后支路的,黑色结点数差一。旋转的图示如上图所示,以grandparent结点为轴,向右旋转。将grandparent结点作为parent结点的右子树进行旋转。同时需要的是,grandparent结点不一定是根节点,我们需要提前保留并判断grandparent->_parent结点,之后重新赋给parent->_parent。
情况三、
如果可以理解了第二种情况,第三种情况就容易理解了许多,和第二种情况一样,只不过cur是parent的右子树,我们需要先以parent为轴,向左旋转,得到上面这种情况之后,再以grandparent为轴向右旋转。如下图。
值得注意的一点,也是一开始写代码总是验证出错的一个问题,我们先以parent为轴左旋,之后看上图,cur此时变成了parent->_parent,如果此时按照情况二的处理方式,结点颜色一定会发生问题,因此,在上图中,我专门给出了一张图,将parent和cur指针交换,注意,只交换的是指针。
到这里,红黑树的基本情况以及处理完毕,再有的话就是当parent一开始就是在grandparent的右子树上的几种情况,和上面的旋转成镜像的关系。下面给出具体的代码:
bool Insert(const K& key,const V& value) { //空树 if (_root == NULL) { _root = new Node(key, value); _root->_color = BLACK; return true; } //构建节点,并插入到对应位置 Node* cur = _root; Node* parent = NULL; while (cur != NULL) { if (key > cur->_key) { parent = cur; cur = cur->_right; } else if (key < cur->_key) { parent = cur; cur = cur->_left; } else { return false; } } cur = new Node(key, value); if (key > (parent->_key)) { parent->_right = cur; cur->_parent = parent; } else { parent->_left = cur; cur->_parent = parent; } //开始调整 while (cur != _root && parent->_color == RED) { //如果parent的color为RED,parent一定不是根节点,且祖父节点color为BLACK Node* grandparentnode = parent->_parent;//grandparentnode->_color = BLACK; if (parent == grandparentnode->_left) { Node* unclenode = grandparentnode->_right;//叔叔节点uncle if (unclenode && (unclenode->_color == RED))//uncle不为空,且uncle->color为RED { parent->_color = BLACK; unclenode->_color = BLACK; grandparentnode->_color = RED; cur = grandparentnode; parent = cur->_parent; } else//uncle为空,或uncle->color为BLACK { if (cur == parent->_right) { RotateL(parent); std::swap(parent, cur); } RotateR(grandparentnode); parent->_color = BLACK; grandparentnode->_color = RED; break; } } else//parent == grandparent->_right { Node* unclenode = grandparentnode->_left; if (unclenode && (unclenode->_color == RED))//uncle存在,且color为 RED { parent->_color = BLACK; unclenode->_color = BLACK; grandparentnode->_color = RED; cur = grandparentnode; parent = cur->_parent; } else//uncle不存在,或uncle->color为黑色 { if (cur == parent->_left) { RotateR(parent); std::swap(cur,parent); } RotateL(grandparentnode); grandparentnode->_color = RED; parent->_color = BLACK; break; } } } //统一将根节点的颜色变为黑色 _root->_color = BLACK; return true; }
红黑树结点的插入到这里就结束了,可以发现的是,我们其实一直在关注的是uncle结点,也就是cur的叔叔结点。这是红黑树插入思想里面的一个核心。
下面,就红黑树的基本特征,给出一段检验函数,判断红黑树是否满足要求。
bool IsBalance() { if (_root == NULL) return true; if (_root->_color == RED) return false; int count = 0; Node* cur = _root; while (cur != NULL) { if (cur->_color == BLACK) { count++; } cur = cur->_left; } int k = 0; return _IsBalance(_root, count, k); } bool _IsBalance(Node* root, const int& count, int k) { if (root == NULL) return true; if (root != _root && root->_color == RED) { if (root->_parent->_color == RED) { cout << "连续红色结点" << root->_key << endl; return false; } } if (root->_color == BLACK) k++; if (root->_left == NULL && root->_right == NULL) { if (k == count) return true; else { cout << "黑色节点不相等" << root->_key << endl; return false; } } return _IsBalance(root->_left, count, k) && _IsBalance(root->_right, count, k); }
红黑树的应用远比AVL树多,还是一开始我们说的,其实红黑树的高度相对来说要比AVL树高出一些的,但这其实并不影响太多。因为我们的时间复杂度都是在O(log n)附近,当n = 10亿时,log(n)也仅仅只有30。但是另一方面,由于红黑树要比AVL树的要求低,所以当我们插入一个结点时,相对来说调整的次数也就少了许多,这个是红黑树的优势。
------muhuizz整理