上篇博客主要讲述了二叉排序树的基本概念和插入删除操作,必须再次说明的是:在一棵高度为h的二叉排序树上,实现动态集合操作查询,插入和删除的运行时间均为O(h)。
可见二叉树的基本操作效率取决于树的形态,当然树的高度越低越好,显然树分布越均匀,高度越低。那么,问题来了?对于给定的关键字序列,如何构造一棵形态匀称的二叉排序树。这种匀称的二叉排序树就称为平衡二叉树。
平衡二叉树定义:平衡二叉树或为空树,或其上任意一个节点,节点的左右子树高度差不超过1. 通常将二叉树上所有结点的左右子树的高度之差称为平衡因子。
构造平衡二叉树的常用算法有AVL树和红黑树等。其中,AVL树保持平衡的机制是靠平衡因子和旋转,而红黑树保持平衡的机制是靠 节点颜色约束和旋转,事实上,红黑树并不追求完全平衡,只能算部分平衡:没有路径能多余其他路径2倍长,但红黑树能以O(log2 n)的时间复杂度进行查询删除插入操作。 本篇博客先介绍AVL,下篇博客再讲解红黑树。
构造AVL树的基本思想:每当插入一个新结点时,首先检查是否因插入而破坏了树的平衡性;在保持二叉排序树的特性同时,(也就是说平衡二叉树得首先保证它是二叉排序树)调整最小不平衡子树各结点之间的指向,以达到新的平衡。<所谓最小不平衡子树就是指离插入点最近,且平衡因子大于1的结点作为根的子树,简而言之:就是从新插入结点位置开始向根节点寻找,第一个由平衡变为不平衡的结点>
与二叉排序树相比,平衡二叉树插入节点后还要保证插入后既要保证有序,又要保证平衡。那么保证的方法就是:旋转
插入新节点N导致平衡二叉树不再平衡,最小不平衡子树的根为A,插入位置不同,插入后调整节点平衡因子和指向也不同。可以归纳为如下4种情况(如图所示):
注:图中节点用圈表示,子树用长方形表示,代表不止一个结点,可能一个,可能多个节点,长方形长度代表子树高度。红色标记为指针指向变化示意。
1> LL,新插入节点在A左孩子的左子树上:右旋,如图所示,当新添加节点N时,节点A的平衡因子bf(blancefactor)由1变为2,为了书写清晰直观描述为:A.bs = 1-->2(以下格式同) 而B.bs = 0--->1。为了保持平衡,这时需要节点A需要绕B向右旋转。
形象点说,就是指节点A本来就已经快要不平衡了(bs=1,左子树比右子树高),这个时候其左子树又添加一个结点,这不是压死骆驼的最后一根稻草么。。。这个时候就需要让树往右边旋转,降低节点A的高度。而节点B 添加N之前 bs=0,表示还有承受能力,这个时候给它加加担子,让他由小兵变将军,升到根节点去,这样树就变为平衡了。废话有点多,但是好理解。具体调整过程见代码。
//右旋转处理函数 void R_Rotate( BSTree &p) { BSTree lc; lc=p->lchild; p->lchild=lc->rchild; lc->rchild=p; p=lc; }
2>RR,新插入节点在A右孩子的右子树上:左旋;如图所示。和右旋原理类似,本来右子树就高,再来一节点,不得不左旋。
//左旋转处理函数 void L_Rotate(BSTree &p) { BSTree rc; rc=p->rchild; p->rchild=rc->lchild; rc->lchild=p; p=rc; }
3>LR,新插入节点在A左子树的右子树上,先左旋再右旋,准确点说是在A左子树的右子树的(左子树或右子上)
相比于操作1>和操作2>,操作3>相对复杂。这样操作的原因在于:插入新的节点N之前,根节点A和其左子树根节点B都是平衡因子不为0的节点:也就是说A.bf=1 B.bf=-1;
即他们与不平衡只差一步之遥了,再添加一个节点,且都是添加在他们的A的左子树,B的右子树的左子树下,他们要被压死了,这个时候,根节点A对子节点B说,你来当根节点。B一看,我的不平衡因子也不是0,没法当啊;于是,B左旋,把C顶上去。对A说,我不能当根节点,但是C可以,于是,再一次绕C右旋转,A下来,C当上了根节点。
,为什么C能当根节点?因为添加前C的平衡因子为0,即使添加一个节点后,它与不平衡依然还有一步之遥。
具体过程见代码
//插入操作时左平衡旋转处理函数---包含平衡因子的修改 void LeftBalance(BSTree &T) { BSTree lc,rd; lc=T->lchild; switch(lc->bf) //检查T的左子树的平衡度,判断是操作1>还是操作3>,并作相应的平衡处理 { case LH: //操作1>:做单右旋处理 T->bf=lc->bf=EH;//1 新结点插入在T的左子树上,先修改平衡因子再右旋 R_Rotate(T); break; case RH: //操作3> rd=lc->rchild;//-1 新结点插入在T的左孩子的右子树上, switch(rd->bf) { //修改T及左孩子的平衡因子 case LH:T->bf=RH;//新节点插在rd下作为左子树 lc->bf=EH;// break; case EH:T->bf=lc->bf=EH;// break; case RH:T->bf=EH;//新节点插在rd下作为右子树 lc->bf=LH; break; } rd->bf=EH; L_Rotate(T->lchild);//对T的左子树左旋处理 R_Rotate(T);//再对T做右旋处理 } }
4>RL,新插入节点在A右子树的左子树上,先右旋再左旋。过程和LR是类似的,不再赘述。
直接贴代码
//插入操作时右平衡旋转处理函数 void RightBalance(BSTree &T) { BSTree rc,ld; rc=T->rchild; switch(rc->bf) //检查T的右子树的平衡度,并作相应的平衡处理 { case RH:T->bf=rc->bf=EH; L_Rotate(T); break; case LH:ld=rc->lchild; switch(ld->bf) { case LH:T->bf=EH; rc->bf=RH; break; case EH:T->bf=rc->bf=EH; break; case RH:T->bf=LH; rc->bf=EH; break; } ld->bf=EH; R_Rotate(T->rchild); L_Rotate(T); } }