查找一 线性表的查找
目录
查找的基本概念
什么是查找?
查找是根据给定的某个值,在表中确定一个关键字的值等于给定值的记录或数据元素。
查找算法的分类
若在查找的同时对表记录做修改操作(如插入和删除),则相应的表称之为动态查找表;
否则,称之为静态查找表。
此外,如果查找的全过程都在内存中进行,称之为内查找;
反之,如果查找过程中需要访问外存,称之为外查找。
查找算法性能比较的标准
——平均查找长度ASL(Average Search Length)
由于查找算法的主要运算是关键字的比较过程,所以通常把查找过程中对关键字需要执行的平均比较长度(也称为平均比较次数)作为衡量一个查找算法效率优劣的比较标准。
选取查找算法的因素
(1) 使用什么数据存储结构(如线性表、树形表等)。
(2) 表中的次序,即对无序表还是有序表进行查找。
顺序查找
要点
它是一种最简单的查找算法,效率也很低下。
存储结构
没有存储结构要求,可以无序,也可以有序。
基本思想
从数据结构线形表的一端开始,顺序扫描,依次将扫描到的结点关键字与给定值k相比较,若相等则表示查找成功;
若扫描结束仍没有找到关键字等于k的结点,表示查找失败。
核心代码
public int orderSearch(int[] list, int length, int key) {
// 从前往后扫描list数组,如果有元素的值与key相等,直接返回其位置
for (int i = 0; i < length; i++) {
if (key == list[i]) {
return i;
}
}
// 如果扫描完,说明没有元素的值匹配key,返回-1,表示查找失败
return -1;
}
算法分析
顺序查找算法最好的情况是,第一个记录即匹配关键字,则需要比较 1 次;
最坏的情况是,最后一个记录匹配关键字,则需要比较 N 次。
所以,顺序查找算法的平均查找长度为
ASL = (N + N-1 + ... + 2 + 1) / N = (N+1) / 2
顺序查找的平均时间复杂度为O(N)。
二分查找
要点
二分查找又称折半查找,它是一种效率较高的查找方法。
存储结构
使用二分查找需要两个前提:
(1) 必须是顺序存储结构。
(2) 必须是有序的表。
基本思想
首先,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;
否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表。
重复以上过程,直到找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功。
核心代码
public class BlockSearch { class IndexType { public int key; // 分块中的最大值 public int link; // 分块的起始位置 } // 建立索引方法,n 是线性表最大长度,gap是分块的最大长度 public IndexType[] createIndex(int[] list, int n, int gap) { int i = 0, j = 0, max = 0; int num = n / gap; IndexType[] idxGroup = new IndexType[num]; // 根据步长数分配索引数组大小 while (i < num) { j = 0; idxGroup[i] = new IndexType(); idxGroup[i].link = gap * i; // 确定当前索引组的第一个元素位置 max = list[gap * i]; // 每次假设当前组的第一个数为最大值 // 遍历这个分块,找到最大值 while (j < gap) { if (max < list[gap * i + j]) { max = list[gap * i + j]; } j++; } idxGroup[i].key = max; i++; } return idxGroup; } // 分块查找算法 public int blockSearch(IndexType[] idxGroup, int m, int[] list, int n, int key) { int mid = 0; int low = 0; int high = m -1; int gap = n / m; // 分块大小等于线性表长度除以组数 // 先在索引表中进行二分查找,找到的位置存放在 low 中 while (low <= high) { mid = (low + high) / 2; if (idxGroup[mid].key >= key) { high = mid - 1; } else { low = mid + 1; } } // 在索引表中查找成功后,再在线性表的指定块中进行顺序查找 if (low < m) { for (int i = idxGroup[low].link; i < idxGroup[low].link + gap; i++) { if (list[i] == key) return i; } } return -1; } // 打印完整序列 public void printAll(int[] list) { for (int value : list) { System.out.print(value + " "); } System.out.println(); } // 打印索引表 public void printIDX(IndexType[] list) { System.out.println("构造索引表如下:"); for (IndexType elem : list) { System.out.format("key = %d, link = %d\n", elem.key, elem.link); } System.out.println(); } public static void main(String[] args) { int key = 85; int array[] = { 8, 14, 6, 9, 10, 22, 34, 18, 19, 31, 40, 38, 54, 66, 46, 71, 78, 68, 80, 85 }; BlockSearch search = new BlockSearch(); System.out.print("线性表: "); search.printAll(array); IndexType[] idxGroup = search.createIndex(array, array.length, 5); search.printIDX(idxGroup); int pos = search.blockSearch(idxGroup, idxGroup.length, array, array.length, key); if (-1 == pos) { System.out.format("查找key = %d失败", key); } else { System.out.format("查找key = %d成功,位置为%d", key, pos); } } } 分块查找之JAVA实现
运行结果
线性表: 8 14 6 9 10 22 34 18 19 31 40 38 54 66 46 71 78 68 80 85
构造索引表如下:
key = 14, link = 0
key = 34, link = 5
key = 66, link = 10
key = 85, link = 15
查找key = 85成功,位置为19
算法分析
因为分块查找实际上是两次查找过程之和。若以二分查找来确定块,显然它的查找效率介于顺序查找和二分查找之间。
三种线性查找的PK
(1) 以平均查找长度而言,二分查找 > 分块查找 > 顺序查找。
(2) 从适用性而言,顺序查找无限制条件,二分查找仅适用于有序表,分块查找要求“分块有序”。
(3) 从存储结构而言,顺序查找和分块查找既可用于顺序表也可用于链表;而二分查找只适用于顺序表。
(4) 分块查找综合了顺序查找和二分查找的优点,既可以较为快速,也能使用动态变化的要求。