数据结构快速回顾——平衡二叉树 AVL (转)

  平衡二叉树(Balanced Binary Tree)是二叉查找树的一个进化体,也是第一个引入平衡概念的二叉树。1962年,G.M. Adelson-Velsky 和 E.M. Landis发明了这棵树,所以它又叫AVL树。平衡二叉树要求对于每一个节点来说,它的左右子树的高度之差不能超过1,如果插入或者删除一个节点使得高度之差大于1,就要进行节点之间的旋转,将二叉树重新维持在一个平衡状态。这个方案很好的解决了二叉查找树退化成链表的问题,把插入,查找,删除的时间复杂度最好情况和最坏情况都维持在O(logN)。但是频繁旋转会使插入和删除牺牲掉O(logN)左右的时间,不过相对二叉查找树来说,时间上稳定了很多。

  平衡二叉树实现的大部分过程和二叉查找树是一样的(学平衡二叉树之前一定要会二叉查找树),区别就在于插入和删除之后要写一个旋转算法去维持平衡,维持平衡需要借助一个节点高度的属性。我参考了机械工业出版社的《数据结构与算法分析-C语言描述》写了一个C++版的代码。这本书的AVLTree讲的很好,不过没有很完整的去描述。我会一步一步的讲解如何写平衡二叉树,重点是平衡二叉树的核心部分,也就是旋转算法。

第一步:节点信息

  相对于二叉查找树的节点来说,我们需要用一个属性二叉树的高度,目的是维护插入和删除过程中的旋转算法。

代码如下:

//AVL树节点信息

 1 class tnode
 2 {
 3     public:
 4     int val;
 5     int hgt;
 6     int freq;
 7     tnode* pleft;
 8     tnode* pright;
 9     tnode(int v):val(v),hgt(0),freq(1),pleft(NULL),pright(NULL){};
10     tnode():val(0x7fffffff),hgt(0),freq(1),pleft(NULL),pright(NULL){};
11
12 };

第二步:声明头结点

tnode *head;

第三步:两个辅助方法

  旋转算法需要借助于两个功能的辅助,一个是求树的高度,一个是求两个高度的最大值。这里规定,一棵空树的高度为-1,只有一个根节点的树的高度为0,以后每多一层高度加1。为了解决指针NULL这种情况,写了一个求高度的函数,这个函数还是很有必要的。

代码如下:

//计算以节点为根的树的高度

1 int height(tnode *t)
2 {
3     if(t)
4         return t->hgt;
5     else
6         return -1;
7 }

第四步:旋转

  对于一个平衡的节点,由于任意节点最多有两个儿子,因此高度不平衡时,此节点的两颗子树的高度差2.容易看出,这种不平衡出现在下面四种情况:

  1、6节点的左子树3节点高度比右子树7节点大2,左子树3节点的左子树1节点高度大于右子树4节点,这种情况成为左左。

  2、6节点的左子树2节点高度比右子树7节点大2,左子树2节点的左子树1节点高度小于右子树4节点,这种情况成为左右。

  3、2节点的左子树1节点高度比右子树5节点小2,右子树5节点的左子树3节点高度大于右子树6节点,这种情况成为右左。

  4、2节点的左子树1节点高度比右子树4节点小2,右子树4节点的左子树3节点高度小于右子树6节点,这种情况成为右右。

  从图2中可以可以看出,1和4两种情况是对称的,这两种情况的旋转算法是一致的,只需要经过一次旋转就可以达到目标,我们称之为单旋转。2和3两种情况也是对称的,这两种情况的旋转算法也是一致的,需要进行两次旋转,我们称之为双旋转。

第五步:单旋转

  单旋转是针对于左左和右右这两种情况的解决方案,这两种情况是对称的,只要解决了左左这种情况,右右就很好办了。图3是左左情况的解决方案,节点k2不满足平衡特性,因为它的左子树k1比右子树Z深2层,而且k1子树中,更深的一层的是k1的左子树X子树,所以属于左左情况。

  为使树恢复平衡,我们把k2变成这棵树的根节点,因为k2大于k1,把k2置于k1的右子树上,而原本在k1右子树的Y大于k1,小于k2,就把Y置于k2的左子树上,这样既满足了二叉查找树的性质,又满足了平衡二叉树的性质。

  这样的操作只需要一部分指针改变,结果我们得到另外一颗二叉查找树,它是一棵AVL树,因为X向上一移动了一层,Y还停留在原来的层面上,Z向下移动了一层。整棵树的新高度和之前没有在左子树上插入的高度相同,插入操作使得X高度长高了。因此,由于这颗子树高度没有变化,所以通往根节点的路径就不需要继续旋转了。

代码如下:

 1 //左左旋转
 2 void LLRotate(tnode *&tree)
 3 {
 4     tnode *tmp;
 5     tmp = tree->pleft;
 6     tree->pleft = tmp->pright;
 7     tmp->pright = tree;
 8
 9     tree->hgt=max(height(tree->pleft),height(tree->pright))+1;
10     tmp->hgt= max(height(tmp->pleft),tree->hgt)+1;
11     //
12     tree = tmp;
13 }
14
15 //右右旋转
16 void RRRotate(tnode *&tree)
17 {
18     tnode *tmp;
19     tmp = tree->pright;
20     tree->pright=tmp->pleft;
21     tmp->pleft=tree;
22
23     tree->hgt=max(height(tree->pleft),height(tree->pright))+1;
24     tmp->hgt= max(height(tmp->pleft),tree->hgt)+1;
25
26     tree = tmp;
27 }

第六步:双旋转

  对于左右和右左这两种情况,单旋转不能使它达到一个平衡状态,要经过两次旋转。双旋转是针对于这两种情况的解决方案,同样的,这样两种情况也是对称的,只要解决了左右这种情况,右左就很好办了。图4是左右情况的解决方案,节点k3不满足平衡特性,因为它的左子树k1比右子树Z深2层,而且k1子树中,更深的一层的是k1的右子树k2子树,所以属于左右情况。

  为使树恢复平衡,我们需要进行两步,第一步,把k1作为根,进行一次右右旋转,旋转之后就变成了左左情况,所以第二步再进行一次左左旋转,最后得到了一棵以k2为根的平衡二叉树树。

代码如下:

 1 //左右旋转
 2 void LRRotate(tnode *&tree)
 3 {
 4     RRRotate(tree->pleft);
 5     LLRotate(tree);
 6 }
 7
 8 //右左旋转
 9 void RLRotate(tnode *&tree)
10 {
11     LLRotate(tree->pright);
12     RRRotate(tree);
13 }

第七步:插入

  插入的方法和二叉查找树基本一样,区别是,插入完成后需要从插入的节点开始维护一个到根节点的路径,每经过一个节点都要维持树的平衡。维持树的平衡要根据高度差的特点选择不同的旋转算法。

代码如下:

//插入

 1 void insert(tnode *&tree,int v)
 2 {
 3     if(tree == NULL)
 4     {
 5         tree = new tnode(v);
 6         return;
 7     }
 8     if(tree->val > v)
 9     {
10         insert(tree->pleft,v);
11         if(2 == height(tree->pleft)-height(tree->pright))
12         {
13             if(v<tree->pleft->val)
14                 LLRotate(tree);
15             else
16                 LRRotate(tree);
17         }
18     }
19     else if(tree->val < v)
20     {
21         insert(tree->pright,v);
22         if( 2 == height(tree->pright)-height(tree->pleft))
23         {
24             if(v > tree->pright->val)
25                 RRRotate(tree);
26             else
27                 RLRotate(tree);
28         }
29     }
30     else
31         (tree->freq)++;
32
33     tree->hgt = max(height(tree->pleft),height(tree->pright))+1;
34 }

 

第八步:中序遍历

代码如下:

//中序遍历函数

1 void inOrder(tnode *tree)
2 {
3     if(tree == NULL)return;
4     inOrder(tree->pleft);
5 //    printf("%d\t",tree->val);
6     printf("num:%d\thgt:%d\t",tree->val,tree->hgt);
7     inOrder(tree->pright);
8 }

第十一步:关于效率

  此数据结构插入、查找和删除的时间复杂度均为O(logN),但是插入和删除需要额外的旋转算法需要的时间,有时旋转过多也会影响效率。

  关于递归和非递归。我用的是递归的方法进行插入,查找和删除,而非递归的方法一般来说要比递归的方法快很多,但是我感觉非递归的方法写出来会比较困难,所以我还是选择了递归的方法。

  还有一种效率的问题是关于高度信息的存储,由于我们需要的仅仅是高度的差,不需要知道这棵树的高度,所以只需要使用两个二进制位就可以表示这个差。这样可以避免平衡因子的重复计算,可以稍微的加快一些速度,不过代码也丧失了相对简明性和清晰度。如果采用递归写法的话,这种微加速就更显得微乎其微了。

由于原文在左旋右旋函数中忘记更新父类节点的指向、插入函数中节点高度的计算忘记+1;本文对其内容介绍摘抄过来,但是修正了相应的函数。

摘自:http://www.cppblog.com/cxiaojia/archive/2014/03/02/187776.html

数据结构快速回顾——平衡二叉树 AVL (转)

时间: 2025-01-17 23:44:10

数据结构快速回顾——平衡二叉树 AVL (转)的相关文章

数据结构快速回顾——图的遍历

图的遍历指的是从图中的任一顶点出发,对图中的所有顶点访问一次且只访问一次.图的遍历操作和树的遍历操作功能相似.图的遍历是图的一种基本操作,图的许多其它操作都是建立在遍历操作的基础之上. 图的遍历方法目前有深度优先搜索法和广度(宽度)优先搜索法两种算法. 深度优先搜索法DFS 深度优先搜索法的基本思想是:从图G的某个顶点v0出发,访问v0,然后选择一个与v0相邻且没被访问过的顶点vi访问,再从vi出发选择一个与vi相邻且未被访问的顶点vj进行访问,依次继续.如果当前被访问过的顶点的所有邻接顶点都已

数据结构快速回顾——栈

堆栈,也可直接称栈,是一种特殊的串行形式的数据结构,它的特殊之处在于只能允许在链结串行或阵列的一端进行加入资料和输出资料的运算.另外堆栈也可以用一维阵列或连结串行的形式来完成. 1 #define STACK_INIT_SIZE 100 2 #define STACKINCREMENT 10 3 4 typedef struct 5 { int* top; 6 int* base; 7 int stacksize; 8 }SqStack; 9 10 int InitStack(SqStack &

数据结构快速回顾——二叉树 解幂子集问题

回溯法是设计递归的一种常用方法,它的求解过程实质上就是一个先序遍历一棵"状态树"的过程,只是这棵树不是遍历前预先建立的而是隐含在遍历过程中的. 下面举一个例子:求含n个元素的集的幂集:集合A={ {1,2,3}, {1,2}, {1,3}, {1}, {2,3},{2},{3},{}}; //{}表示空集合从集合A的每一个元素的角度看,它只有两种状态:或者是属于幂集的元素集,或不属于幂集元素集,则求幂集的过程就可以看成是依次对集合A中的元素进行"取","舍

数据结构快速回顾——二叉树

二叉树(Binary Tree)是个有限元素的集合,该集合或者为空.或者由一个称为根(root)的元素及两个不相交的.被分别称为左子树和右子树的二叉树组成.当集合为空时,称该二叉树为空二叉树.在二叉树中,一个元素也称作一个结点. 基本概念: (1)结点的度.结点所拥有的子树的个数称为该结点的度. (2)叶结点.度为0的结点称为叶结点,或者称为终端结点. (3)分枝结点.度不为0的结点称为分支结点,或者称为非终端结点.一棵树的结点除叶结点外,其余的都是分支结点. (4)左孩子.右孩子.双亲.树中一

数据结构快速回顾——二叉查找树

二叉查找树(Binary Search Tree),也称有序二叉树(ordered binary tree),排序二叉树(sorted binary tree),是指一棵空树或者具有下列性质的二叉树: 若任意节点的左子树不空,则左子树上所有结点的值均小于它的根结点的值: 任意节点的右子树不空,则右子树上所有结点的值均大于它的根结点的值: 任意节点的左.右子树也分别为二叉查找树. 没有键值相等的节点(no duplicate nodes). 二叉查找树相比于其他数据结构的优势在于查找.插入的时间复

数据结构复习之平衡二叉树AVL删除

平衡二叉树的插入过程:http://www.cnblogs.com/hujunzheng/p/4665451.html 对于二叉平衡树的删除采用的是二叉排序树删除的思路: 假设被删结点是*p,其双亲是*f,不失一般性,设*p是*f的左孩子,下面分三种情况讨论: ⑴ 若结点*p是叶子结点,则只需修改其双亲结点*f的指针即可. ⑵ 若结点*p只有左子树PL或者只有右子树PR,则只要使PL或PR 成为其双亲结点的左子树即可. ⑶ 若结点*p的左.右子树均非空,先找到*p的中序前趋结点*s(注意*s是*

数据结构复习之平衡二叉树AVL插入

平衡二叉树(Balancedbinary tree)是由阿德尔森-维尔斯和兰迪斯(Adelson-Velskiiand Landis)于1962年首先提出的,所以又称为AVL树. 定义:平衡二叉树或为空树,或为如下性质的二叉排序树: (1)左右子树深度之差的绝对值不超过1; (2)左右子树仍然为平衡二叉树. 平衡二叉树可以避免排序二叉树深度上的极度恶化,使树的高度维持在O(logn)来提高检索效率. 因为插入节点导致整个二叉树失去平衡分成如下的四种情况: 假设由于在二叉排序树上插入节点而失去平衡

数据结构快速回顾——开篇

六月到了.开始找工作的节奏,IT方面知识储备严重欠缺,定计划,更新博客,记录自己的准备历程. 1.数据结构 15天 2.常用算法(排序.动态规划.贪心等) 30天 3.数据挖掘算法 15天 4.移动端.web端开发入门 15天 5.操作系统 10天 共计85天,那时将近9月,还能赶上找工作的大潮. 何为数据结构?数据结构用处?一般来说,使用计算机解决一个问题的时候需要经历以下步骤:分析问题.抽象出数学模型.设计解数学模型的算法.写程序.测试.得到最终结果.为了解决非数值型数学模型,需要使用诸如表

7. 蛤蟆的数据结构进阶七平衡二叉树

7. 蛤蟆的数据结构进阶七平衡二叉树 本地名言:"金钱的贪求(这个毛病,目前我们大家都犯得很凶)和享乐的贪求,促使我们成为它们的奴隶,也可以说,把我们整个身心投入深渊.唯利是图,是一种痼疾,使人卑鄙,但贪求享乐,更是一种使人极端无耻,不可救药的毛病. --郎加纳斯" 我们来看下传说中的平衡二叉树,为什么说他传说中呢?因为蛤蟆接触ORACLE数据库比较多,而ORACLE数据中用到最多的索引就是平衡二叉树,所以嘛. 欢迎转载,转载请标明出处:http://write.blog.csdn.n