纸上谈兵: 树, 二叉树, 二叉搜索树

树的特征和定义

树(Tree)是元素的集合。我们先以比较直观的方式介绍树。下面的数据结构是一个树:

树有多个节点(node),用以储存元素。某些节点之间存在一定的关系,用连线表示,连线称为边(edge)。边的上端节点称为父节点,下端称为子节点。树像是一个不断分叉的树根。

每个节点可以有多个子节点(children),而该节点是相应子节点的父节点(parent)。比如说,3,5是6的子节点,6是3,5的父节点;1,8,7是3的子节点, 3是1,8,7的父节点。树有一个没有父节点的节点,称为根节点(root),如图中的6。没有子节点的节点称为叶节点(leaf),比如图中的1,8,9,5节点。

从图中还可以看到,上面的树总共有4个层次,6位于第一层,9位于第四层。树中节点的最大层次被称为深度。也就是说,该树的深度(depth)为4。

如果我们从节点3开始向下看,而忽略其它部分。那么我们看到的是一个以节点3为根节点的树:

三角形代表一棵树

再进一步,如果我们定义孤立的一个节点也是一棵树的话,原来的树就可以表示为根节点和子树(subtree)的关系:

上述观察实际上给了我们一种严格的定义树的方法:

  • 树是元素的集合。
  • 该集合可以为空。这时树中没有元素,我们称树为空树 (empty tree)。
  • 如果该集合不为空,那么该集合有一个根节点,以及0个或者多个子树。根节点与它的子树的根节点用一个边(edge)相连。

上面的第三点是以递归的方式来定义树,也就是在定义树的过程中使用了树自身(子树)。由于树的递归特征,许多树相关的操作也可以方便的使用递归实现。我们将在后面看到。

(上述定义来自"Data Structures and Algorithm Analysis in C, by Mark Allen Weiss"。 我觉得有一点不太严格的地方。如果说空树属于树,第三点应该是 “...以及0个和多个非空子树...” )

树的实现

树的示意图已经给出了树的一种内存实现方式: 每个节点储存元素和多个指向子节点的指针。然而,子节点数目是不确定的。一个父节点可能有大量的子节点,而另一个父节点可能只有一个子节点,而树的增删节点操作会让子节点的数目发生进一步的变化。

这种不确定性就可能带来大量的内存相关操作,并且容易造成内存的浪费。

一种经典的实现方式如下:

树的内存实现

拥有同一父节点的两个节点互为兄弟节点(sibling)。上图的实现方式中,每个节点包含有一个指针指向第一个子节点,并有另一个指针指向它的下一个兄弟节点。这样,我们就可以用统一的、确定的结构来表示每个节点。

计算机的文件系统是树的结构,比如Linux文件管理背景知识中所介绍的。在UNIX的文件系统中,每个文件(文件夹同样是一种文件),都可以看做是一个节点。非文件夹的文件被储存在叶节点。

文件夹中有指向父节点和子节点的指针(在UNIX中,文件夹还包含一个指向自身的指针,这与我们上面见到的树有所区别)。在git中,也有类似的树状结构,用以表达整个文件系统的版本变化 (参考版本管理三国志)。

文件树

二叉搜索树的C实现

二叉树(binary)是一种特殊的树。二叉树的每个节点最多只能有2个子节点:

二叉树

由于二叉树的子节点数目确定,所以可以直接采用上图方式在内存中实现。每个节点有一个左子节点(left children)和右子节点(right children)。左子节点是左子树的根节点,右子节点是右子树的根节点。

如果我们给二叉树加一个额外的条件,就可以得到一种被称作二叉搜索树(binary search tree)的特殊二叉树。二叉搜索树要求:每个节点都不比它左子树的任意元素小,而且不比它的右子树的任意元素大。

(如果我们假设树中没有重复的元素,那么上述要求可以写成:每个节点比它左子树的任意节点大,而且比它右子树的任意节点小)

二叉搜索树,注意树中元素的大小

二叉搜索树可以方便的实现搜索算法。在搜索元素x的时候,我们可以将x和根节点比较:

  • 如果x等于根节点,那么找到x,停止搜索 (终止条件)
  • 如果x小于根节点,那么搜索左子树
  • 如果x大于根节点,那么搜索右子树

二叉搜索树所需要进行的操作次数最多与树的深度相等。n个节点的二叉搜索树的深度最多为n,最少为log(n)。

下面是用C语言实现的二叉搜索树,并有搜索,插入,删除,寻找最大最小节点的操作。每个节点中存有三个指针,一个指向父节点,一个指向左子节点,一个指向右子节点。

(这样的实现是为了方便。节点可以只保存有指向左右子节点的两个指针,并实现上述操作。)

删除节点相对比较复杂。删除节点后,有时需要进行一定的调整,以恢复二叉搜索树的性质(每个节点都不比它左子树的任意元素小,而且不比它的右子树的任意元素大)。

  • 叶节点可以直接删除。
  • 删除非叶节点时,比如下图中的节点8,我们可以删除左子树中最大的元素(或者右树中最大的元素),用删除的节点来补充元素8产生的空缺。但该元素可能也不是叶节点,所以它所产生的空缺需要其他元素补充…… 直到最后删除一个叶节点。上述过程可以递归实现。

删除节点后的二叉搜索树

/* By Vamei *//* binary search tree */#include <stdio.h>#include <stdlib.h>

typedef struct node *position;typedef int ElementTP;

struct node {   position parent;   ElementTP element;   position lchild;   position rchild;};

/* pointer => root node of the tree */typedef struct node *TREE;

void print_sorted_tree(TREE);position find_min(TREE);position find_max(TREE);position find_value(TREE, ElementTP);position insert_value(TREE, ElementTP);ElementTP delete_node(position);

static int is_root(position);static int is_leaf(position);static ElementTP delete_leaf(position);static void insert_node_to_nonempty_tree(TREE, position);

void main(void) {   TREE tr;   position np;   ElementTP element;   tr = NULL;   tr = insert_value(tr, 18);   tr = insert_value(tr, 5);   tr = insert_value(tr, 2);    tr = insert_value(tr, 8);   tr = insert_value(tr, 81);   tr = insert_value(tr, 101);   printf("Original:\n");   print_sorted_tree(tr);

   np = find_value(tr, 8);   if(np != NULL) {       delete_node(np);       printf("After deletion:\n");       print_sorted_tree(tr);   }}

/* * print values of the tree in sorted order*/void print_sorted_tree(TREE tr){   if (tr == NULL) return;   print_sorted_tree(tr->lchild);   printf("%d \n", tr->element);   print_sorted_tree(tr->rchild);}

/** search for minimum value* traverse lchild*/position find_min(TREE tr){   position np;   np = tr;   if (np == NULL) return NULL;   while(np->lchild != NULL) {       np = np->lchild;   }   return np;}

/** search for maximum value* traverse rchild*/position find_max(TREE tr){   position np;   np = tr;   if (np == NULL) return NULL;   while(np->rchild != NULL) {       np = np->rchild;   }   return np;}

/** search for value**/position find_value(TREE tr, ElementTP value) {   if (tr == NULL) return NULL; 

   if (tr->element == value) {       return tr;   }   else if (value < tr->element) {       return find_value(tr->lchild, value);   }   else {       return find_value(tr->rchild, value);   }}

/* * delete node np */ElementTP delete_node(position np) {   position replace;   ElementTP element;   if (is_leaf(np)) {       return delete_leaf(np);   }      else {       /* if a node is not a leaf, then we need to find a replacement */       replace = (np->lchild != NULL) ? find_max(np->lchild) : find_min(np->rchild);       element = np->element;       np->element = delete_node(replace);       return element;   }}

/* * insert a value into the tree* return root address of the tree*/position insert_value(TREE tr, ElementTP value) {   position np;   /* prepare the node */   np = (position) malloc(sizeof(struct node));   np->element = value;   np->parent  = NULL;   np->lchild  = NULL;   np->rchild  = NULL;

   if (tr == NULL) tr = np;   else {       insert_node_to_nonempty_tree(tr, np);   }   return tr;}

//=============================================

/** np is root?*/static int is_root(position np){   return (np->parent == NULL);}

/** np is leaf?*/static int is_leaf(position np){   return (np->lchild == NULL && np->rchild == NULL);}

/* * if an element is a leaf, * then it could be removed with no side effect.*/static ElementTP delete_leaf(position np){   ElementTP element;   position parent;   element = np->element;   parent  = np->parent;   if(!is_root(np)) {       if (parent->lchild == np) {           parent->lchild = NULL;       }       else {           parent->rchild = NULL;       }   }   free(np);   return element;}

/** insert a node to a non-empty tree* called by insert_value()*/static void insert_node_to_nonempty_tree(TREE tr, position np){   /* insert the node */   if(np->element <= tr->element) {       if (tr->lchild == NULL) {           /* then tr->lchild is the proper place */           tr->lchild = np;           np->parent = tr;           return;       }       else {           insert_node_to_nonempty_tree(tr->lchild, np);       }   }   else if(np->element > tr->element) {       if (tr->rchild == NULL) {           tr->rchild = np;           np->parent = tr;           return;       }       else {           insert_node_to_nonempty_tree(tr->rchild, np);       }   }}

运行结果:

Original:2 5 8 18 81 101 After deletion:2 5 18 81 101

上述实现中的删除比较复杂。有一种简单的替代操作,称为懒惰删除(lazy deletion)。在懒惰删除时,我们并不真正从二叉搜索树中删除该节点,而是将该节点标记为“已删除”。

这样,我们只用找到元素并标记,就可以完成删除元素了。如果有相同的元素重新插入,我们可以将该节点找到,并取消删除标记。

懒惰删除的实现比较简单,可以尝试一下。树所占据的内存空间不会因为删除节点而减小。懒惰节点实际上是用内存空间换取操作的简便性。

总结

  • 树, 二叉树, 二叉搜索树
  • 二叉搜索树的删除
  • 懒惰删除

原文地址:https://www.cnblogs.com/peke/p/8715903.html

时间: 2024-10-13 13:01:27

纸上谈兵: 树, 二叉树, 二叉搜索树的相关文章

树, 二叉树, 二叉搜索树

转载:Vamei   出处:http://www.cnblogs.com/vamei 树的特征和定义 树(Tree)是元素的集合.我们先以比较直观的方式介绍树.下面的数据结构是一个树: 树有多个节点(node),用以储存元素.某些节点之间存在一定的关系,用连线表示,连线称为边(edge).边的上端节点称为父节点,下端称为子节点.树像是一个不断分叉的树根. 每个节点可以有多个子节点(children),而该节点是相应子节点的父节点(parent).比如说,3,5是6的子节点,6是3,5的父节点:1

数据结构(三):非线性逻辑结构-特殊的二叉树结构:堆、哈夫曼树、二叉搜索树、平衡二叉搜索树、红黑树、线索二叉树

在上一篇数据结构的博文<数据结构(三):非线性逻辑结构-二叉树>中已经对二叉树的概念.遍历等基本的概念和操作进行了介绍.本篇博文主要介绍几个特殊的二叉树,堆.哈夫曼树.二叉搜索树.平衡二叉搜索树.红黑树.线索二叉树,它们在解决实际问题中有着非常重要的应用.本文主要从概念和一些基本操作上进行分类和总结. 一.概念总揽 (1) 堆 堆(heap order)是一种特殊的表,如果将它看做是一颗完全二叉树的层次序列,那么它具有如下的性质:每个节点的值都不大于其孩子的值,或每个节点的值都不小于其孩子的值

二叉树--二叉搜索树

一直对AVL这个英文缩写比较困惑,原来一直以为是平衡二叉树的首字母缩写,但是又想不明白,哈!前段时间才明白原来是种这课树的三个人的名字的首字母的,哎,生活处处有惊喜,无知不可怕,现在我也知道了.废话不多说,下面我们说说,树形结构中的那些平衡二叉树. 二叉排序树 树的遍历顺序有3种,二叉排序树,顾名思义,就是一颗有序的二叉树,是一种按照中序遍历树中节点,而输出有序队列的一种树形结构,一种特殊的树形结构. 定义 对于二叉树,假设x为二叉树中的任意一个结点,x节点包含关键字key,节点x的key值记为

LeetCode98 树&#183;验证二叉搜索树(C++)

题目描述: 给定一个二叉树,判断其是否是一个有效的二叉搜索树. 假设一个二叉搜索树具有如下特征: 节点的左子树只包含小于当前节点的数. 节点的右子树只包含大于当前节点的数. 所有左子树和右子树自身必须也是二叉搜索树. 示例 1: 输入: 2 / 1 3 输出: true 示例 2: 输入: 5 / 1 4   /   3 6 输出: false 解释: 输入为: [5,1,4,null,null,3,6].   根节点的值为 5 ,但是其右子节点值为 4 . /** * Definition f

二叉树-二叉搜索树(中序)

题型: (1)验证 (2)修复(排列不正确,修复) (3)构造(给排列求树-平衡的:种类) (4)利用性质求第n个结点 二叉搜索树的思路:中序输出+相关操作 如果要求空间复杂度O(1),考虑莫里斯遍历 98. 验证二叉搜索树    面试题 04.05. 合法二叉搜索树 (1) 思路:中序排列,看次序 1 class Solution { 2 public boolean isValidBST(TreeNode root) { 3 // if(root==null){ // 题目空树是true 4

查找树ADT——二叉搜索树

在以下讨论中,虽然任意复杂的关键字都是允许的,但为了简单起见,假设它们都是整数,并且所有的关键字是互异的. 总概   使二叉树成为二叉查找树的性质是,对于树中的每个节点X,它的左子树中所有关键字值小于X的关键字值,而它的右子树中所有的关键字值大于X的关键字值.注意,这意味着该树所有的元素可以用某种统一的方式排序. 操作 #ifndef __Tree_H struct TreeNode *Position; typedef struct TreeNode *SearchTree; SearchTr

二叉搜索树的深度与搜索效率图解

二叉搜索树的深度与搜索效率 我们在树, 二叉树, 二叉搜索树中提到,一个有n个节点的二叉树,它的最小深度为log(n),最大深度为n.比如下面两个二叉树: 深度为n的二叉树 深度为log(n)的二叉树 这两个二叉树同时也是二叉搜索树(参考树, 二叉树, 二叉搜索树).注意,log以2为基底.log(n)是指深度的量级.根据我们对深度的定义,精确的最小深度为floor(log(n)+1). 我们将处于同一深度的节点归为一层.如果除最后一层外的其他层都被节点填满时,二叉树有最小深度log(n). 二

平衡二叉搜索树(AVL树)的原理及实现源代码(有图文详解和C++、Java实现代码)

一.AVL树(平衡二叉搜索树)是什么? AVL树是根据它的发明者G.M. Adelson-Velsky和E.M. Landis命名的.AVL树本质上还是一棵二叉搜索树,它的特点是: 1.本身首先是一棵二叉搜索树. 2.带有平衡条件:每个非叶子结点的左右子树的高度之差的绝对值(平衡因子)最多为1. 例如: 5             5 / \            /  \ 2   6         2   6 / \    \         / \ 1  4   7       1  4

数据结构中常见的树(BST二叉搜索树、AVL平衡二叉树、RBT红黑树、B-树、B+树、B*树)

树 即二叉搜索树: 1.所有非叶子结点至多拥有两个儿子(Left和Right): 2.所有结点存储一个关键字: 非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树: 如: BST树的搜索,从根结点开始,如果查询的关键字与结点的关键字相等,那么就命中: 如果BST树的所有非叶子结点的左右子树的结点数目均保持差不多(平衡),那么B树 的搜索性能逼近二分查找:但它比连续内存空间的二分查找的优点是,改变BST树结构 插入与删除结点)不需要移动大段的内存数据,甚至通常是常数开销: 如: