第一章 数据结构绪论
基本概念和术语
数据
数据是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。
换言之,数据就是符号,而且具备两个前提:
1. 可以输入到计算机中
2. 能被计算机程序处理
数据元素
数据元素是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理。也被称为记录。
数据项
一个数据元素可以由若干个数据项组成。
数据项是数据不可分割的最小单位。
数据对象
数据对象是性质相同的数据元素的集合,是数据的子集。
数据结构
数据结构是相互之间存在一种或多种特定关系的数据元素的集合。
逻辑结构与物理结构
逻辑结构
逻辑结构是指数据对象中数据元素之间的相互关系。
逻辑结构分为以下四种:
1. 集合结构
集合结构中的数据元素除了同属于同一个集合外,它们之间没哟其他关系。
2. 线性结构
线性结构中的数据元素之间是一对一的关系。
3. 树形结构
树形结构中的数据元素之间存在一种一对多的层次关系。
4. 图形结构
图形结构的数据元素是多对多的关系。
物理结构(存储结构)
物理结构是指数据的逻辑结构在计算机中的存储形式。
实际上就是如何把数据元素存储到计算机的存储器中。
存储器主要是针对内存而言的,像硬盘、软盘、光盘等外部存储器的数据组织通常用文件结构来描述。
数据结构的存储形式有两种:
1. 顺序存储
顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
数组就是这样的顺序存储结构。
2. 链式存储
链式存储结构是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。
逻辑结构是面向问题的,而物理结构是面向计算机的,其基本目标就是将数据及其逻辑关系存储到计算机的内存中。
抽象数据类型
数据类型
数据类型指一组性质相同的值的集合及定义在此集合上的一些操作的总称。
抽象数据类型
抽象数据类型是指一个数学模型及定义在该模型的一组操作。
抽象数据类型的定义仅取决于它的一组逻辑特性,而与其在计算机内部如何表示和实现无关。
抽象数据类型体现了程序设计中问题分解、抽象和信息隐藏的特性。
描述抽象数据类型的标准格式:
第二章 算法
算法
算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。
算法的特性
算法具有五个基本特性:输入、输出、有穷性、确定性和可行性
输入输出
算法具有零个或多个输入,至少有一个或多个输出。
有穷性
有穷性指算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成。
确定性
确定性指算法的每一步骤都具有确定的含义,不会出现二义性。
可行性
可行性指算法的每一步都必须是可行的,也就是说,每一步都能够通过执行有限次数完成。
算法设计的要求
正确性
“正确”分为以下四个层次
1. 算法程序没有语法错误。
2. 算法程序对于合法的输入数据能够产生满足要求的输出结果。
3. 算法程序对于非法的输入数据能够得出满足规格说明的结果。
4. 算法程序对于精心选择的,甚至刁难的测试数据都有满足要求的输出结果。
可读性
健壮性
健壮性指当输入数据不合法时,算法也能做出相关处理,而不是产生异常或莫名其妙的结果。
时间效率高和存储量低
算法效率的度量方法
事后统计方法
这要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低。
差评,不考虑。
事前分析估算方法
在计算机程序编制前,依据统计方法对算法进行估算。
一个程序的运行时间依赖于算法的好坏和问题的输入规模。所以在分析一个算法的运行时间时,重要的是把基本操作数量与输入规模关联起来,即基本操作的数量必须表示成输入规模的函数。
函数的渐进增长
判断一个算法的效率时,函数中的常数和其他次要项常常可以忽略,而更应该关注主项(最高项)的阶数。
算法时间复杂度
定义
推导大O阶方法
常数阶
顺序结构的时间复杂度为常数阶。
线性阶
n次单变量循环为O(n)
对数阶
下例中的时间复杂度为O(logn)
平方阶
下例中的时间复杂度为O(n2)
例子:
常见的时间复杂度
最坏情况与平均情况
最坏情况运行时间是一种保证,那就是运行时间将不会再坏了。在应用中,这是一种最重要的需求,通常,除非特别指定,我们提到的运行时间都是最坏情况的运行时间。
平均运行时间是所有情况中最有意义的,因为它是期望的运行时间。
算法空间复杂度
算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算公式记作:S(n) = O(f(n)),其中,n为问题的规模,f(n)为语句关于n所占存储空间的函数。