二叉树简介
---------------------------注:本文所用的术语定义均来自国外大学和计算机文献使用的定义,非国内教材。------------------------------
二叉树也是一种树,它特殊在:
1、每个结点的孩子最多只能是2,即二叉树中不存在度大于2的结点。
2、每个结点的孩子结点区分左孩子和又孩子,即便是只有1个孩子结点,也分左孩子和右孩子。
注意:
1、二叉树是 rooted tree。即二叉树必须指定,且固定有一个唯一的root结点。这话听起来很奇怪:只要树不为空,肯定有root结点啊?可是,一般情况下的树,他的每一个结点都可以当做root去看待,只不过我们脑袋里总把一棵树的图形固定去理解而已。但是二叉树的root结点必须是固定唯一,明确指出的。
2、二叉树是有序树(ordered tree)。这点对于啃过国内大学教材的朋友来说就很有争议。我的理解是:二叉树中的孩子是区分左右的,左右不应该和次序混为一谈,只不过二叉树在实现时,都是通过按有序的方式去完成的。
二叉树的性质
1、二叉树的许多性质都和2有关,确切的说是以2为公比,首项为1的等比数列有关。
2、二叉树的第i层上的节点数最多为 2i-1 个 (i>=1) (数列的第i项)
3、k层的二叉树至多有2k - 1个结点(k≥1)。 (当每层都达到做多结点时,达到最大值 。数列的前k项和)
4、在任意一棵二叉树中,若终端(叶子)结点的个数为n0,度为2的结点数为n2,则有:n0=n2+1。
要证明这个性质,就要从点和线的方面去分析。
设:度为2的结点个数有n2个,度为1的结点有n1个,度为0 的叶子结点有n0个,树的总结点为V个。
树的总的 边 的个数为E。
① V = n2 + n1 + n0
② E= V - 1 除了root结点,其他结点都是由头顶上的一条边引出来的。
③ E= 2*n2 + n1 度为2的结点,必顶会向下引出2条边, 同理,度为1的结点会引出1条。
结合3个式子消元得:n0 = n2 + 1
5、一个有n个结点的二叉树,其层次数L 满足不等式
很好理解。当这个二叉树是完全二叉树时,其层次数最小,当每一层仅有1个结点时,层次数最大。
一般二叉树的存储实现
1、使用数组作为内部存储。
这种存储方法只适合完全二叉树,如果是一般二叉树,会造成空间浪费。首先我们需要了解一下当对完全二叉树使用顺序存储时的细节。
给完全二叉树的结点,从上到下,从左到右依次从0开始编号作为这个结点的索引,且索引为i的结点,存储在数组下标为i的地方。则:
如果i==0,则它是root结点。
如果i >0 ,则他的父结点的索引为:
如果 2*(i+1) > n ,则它无左孩子。
2*(i+1) <=n , 则他的左孩子的索引为 2i +1
如果 2*(i+1)+1 > n,则他无右孩子。
2*(i+1)+1 <= n,则它的右孩子的索引为 2i+2
可以发现,使用数组存储完全二叉树是非常高效的,因为结点之间的关系都暗含在索引之中了,无需额外的指针,且数组的随机访问速度也很快。
如过一个一般二叉树要使用这种方法存储,先要填补为一个完全二叉树。
上图可以看出,填充浪费一大半的数组空间,所以,一般二叉树不会使用这种存储策略。
2、链式存储结构:适合用于存储一般形态的二叉树。链式存储更加通用。但是如果是完全二叉树,使用顺序存储更佳。缺点是指针域占用的空间较多。
题目:采用这种设计时,若总结点数为N,则会有多少个空指针域? 答:N+2个。
因为N个结点的树,会有N-1个边,3N个指针域,而每一条边会“消灭”2个空指针域。则空指针域 = 3N-2(N-1) = N+2
有时候我们无需知道一个结点的父结点,则结点的设计可以去掉parent域。
题目:采用这种设计时,若总结点数为N,则会有多少个空指针域?答:N+1
因为N个结点的树,会有N-1个边,2N个指针域,而每一条边会“消灭”1个空指针域。则空指针域 = 2N-(N-1) = N+1