表、栈和队列是最简单和最基本的三种数据结构。基本上,每一个有意义的程序都将明晰地至少使用一种这样的数据结构,比如栈在程序中总是要间接地用到,不管你在程序中是否做了生命。
本章学习重点:
- 理解抽象数据类型(ADT)的概念
- 学习如何对表进行有效的操作
- 熟悉栈ADT及其在实现递归方面的应用
- 熟悉队列ADT及其在操作系统和算法设计中的应用
ADT
抽象数据类型(abstract data type)是一个操作的集合,是数学的抽象,在ADT中不涉及如何实现操作的集合,这可以看作是模块化设计的扩充。
对于每种ADT并不存在什么法则来告诉我们必须要有哪些操作,这是一个设计决策、错误处理和关系重组,一般取决于程序设计者。
表ADT
表可以用数组来实现,查找操作以线性时间执行,插入和删除操作的最坏情况为O(N)。由于插入和删除的低效以及表的大小必须事先已知,所以简单数组一般不用来实现表这种数据结构。
为了避免插入和删除的时间开销,我们需要允许表可以不连续存储,否则表的部分或全部需要整体移动。
程序设计中常常留出一个称之为表头(header)或哑结点(dummy node)的标志结点,它解决了几个棘手的问题:从表头插入元素;删除表头元素;一般删除问题,需要记住被删除元素前面的表元。
三个用例:
- 计算一元多项式,对于大部分项都有的稠密多项式可以用数组来实现,反之其运行时间不被接受,这时候可以用链表快速实现之。
- 实现基数排序。
- 多重表。多名学生随机选多门课(40000名学生和2500门课)用多表实现比二维数组实现高效得多。
栈ADT
栈是限制插入和删除只能在一个位置上进行的表,该位置是表的末端,叫做栈的顶,只有栈顶元素是可以访问的。栈有时也称LIFO(后进先出)表。同表一样,栈既可以用数组,也可以用链表来实现。
由于CreateStack在栈的数组实现中需要一个初始化数组长度的参数,而在链表实现中不需要参数,因此后者的实现中不添加哑元的话,那么这个使用栈的例程就需要知道正在使用的是哪种方法。不幸的是,效率和软件理想主义常常发生冲突。
三个应用:
- 平衡符号,可以用于编译器检查程序的语法错误。
算法描述:做一个空栈,读入字符直到文件尾。如果字符是一个开放符号,则将其推入栈中。如果字符是一个封闭符号,则当栈空时报错。否则,将栈元素弹出。如果弹出的符号不是对应的开放符号,则报错。在文件尾,如果栈非空则报错。
可以看出,算法是线性的且是在线(on-line)的。
2. 后缀表达式。如操作4.99 * 1.06 + 5.99 + 6.99 * 1.06采用后缀(postfix)或逆波兰(reverse Polish)记法:4.99 1.06 * 5.99 + 6.99 1.06 * +
算法描述:当见到一个数时就把它推入栈中,遇到一个运算符时就作用于从该栈弹出的两个数上,将所得结果推入栈中。
时间花费O(N).
除此之外,我们还可以用栈将一个标准形式(也称中缀式(infix))转换成后缀式。
3. 函数调用。不多说了,CSAPP比这里详细得多。
队列ADT
像栈一样,队列也是表。然而,使用队列时插入在一端进行而删除则在另一端进行。队列可以用数组实现也可以用链表实现。
三个应用:
- 当作业送交给一台行式打印机,它们就按照到达的顺序被排列起来。因此,被送往行式打印机的作业基本上是放在一个队列中。
- 这个例子是关于计算机网络的。用许多中PC机的网络设置,其中磁盘是放在一台叫做文件服务器的机器上的。使用其他计算机的用户是按照先到先使用的原则访问文件的,因此其数据结构是一个队列。
- 进一步的例子:
a)当所有的接线员忙的不可开交的时候,对大公司的传呼一般都被放在一个队列中。
b)在大规模的大学里,如果所有的终端都被占用,由于资源有限,学生们必须在一个等待表上签字。在终端上呆的时间最长的学生将首先被强制离开,而等待时间最长的学生则将是下一个被允许使用终端的用户。
正如栈一样,队列还有其他丰富的用途,这样一种简单的数据结构竟然能够如此重要,实在令人惊奇。
Summary
本章描述了一些ADT的概念,并且利用三种最常见的抽象数据类型(ADT)阐述了这个概念。主要目的就是将抽象数据类型的具体实现与它们的功能分开。程序必须知道操作都做些什么,但是如果不知道如何去做实际上更好。
表、栈和队列或许在全部计算机科学中是三个基本的数据结构,大量的例子证明了它们广泛的用途。特别地。我们看到栈是如何用来记录过程和函数调用的,已经递归实际上是如何实现的。理解这些过程是非常重要的,其原因不只是因为它使得过程语音成为可能,而且还因为知道递归的实现从而消除了围绕其使用的大量谜团。虽然递归非常强大,但是它并不是完全随意的操作;递归的误用和乱用可能导致程序崩溃。