#转 二分查找

二分查找

二分查找算法基本思想

二分查找算法的前置条件是,一个已经排序好的序列(在本篇文章中为了说明问题的方便,假设这个序列是升序排列的),这样在查找所要查找的元素时,首先与序列中间的元素进行比较,如果大于这个元素,就在当前序列的后半部分继续查找,如果小于这个元素,就在当前序列的前半部分继续查找,直到找到相同的元素,或者所查找的序列范围为空为止.

用伪代码来表示, 二分查找算法大致是这个样子的:

 1 left = 0, right = n -1
 2
 3 while (left <= right)
 4
 5     mid = (left + right) / 2
 6
 7     case
 8
 9         x[mid] < t:    left = mid + 1;
10
11         x[mid] = t:    p = mid; break;
12
13         x[mid] > t:    right = mid -1;
14
15
16
17 return -1;

第一个正确的程序

根据前面给出的算法思想和伪代码, 我们给出第一个正确的程序,但是,它还有一些小的问题,后面会讲到:

 1 int search(int array[], int n, int v)
 2
 3 {
 4
 5     int left, right, middle;
 6
 7
 8
 9     left = 0, right = n - 1;
10
11
12
13     while (left <= right)
14
15     {
16
17         middle = (left + right) / 2;
18
19         if (array[middle] > v)
20
21         {
22
23             right = middle;
24
25         }
26
27         else if (array[middle] < v)
28
29         {
30
31             left = middle;
32
33         }
34
35         else
36
37         {
38
39             return middle;
40
41         }
42
43     }
44
45
46
47     return -1;
48
49 }  

下面,讲讲在编写二分查找算法时可能出现的一些问题.

边界错误造成的问题

二分查找算法的边界,一般来说分两种情况,一种是左闭右开区间,类似于[left, right),一种是左闭右闭区间,类似于[left, right].需要注意的是, 循环体外的初始化条件,与循环体内的迭代步骤, 都必须遵守一致的区间规则,也就是说,如果循环体初始化时,是以左闭右开区间为边界的,那么循环体内部的迭代也应该如此.如果两者不一致,会造成程序的错误.比如下面就是错误的二分查找算法:

 1 int search_bad(int array[], int n, int v)
 2
 3 {
 4
 5     int left, right, middle;
 6
 7
 8
 9     left = 0, right = n;
10
11
12
13     while (left < right)
14
15     {
16
17         middle = (left + right) / 2;
18
19         if (array[middle] > v)
20
21         {
22
23             right = middle - 1;
24
25         }
26
27         else if (array[middle] < v)
28
29         {
30
31             left = middle + 1;
32
33         }
34
35         else
36
37         {
38
39             return middle;
40
41         }
42
43     }
44
45
46
47     return -1;
48
49 }

这个算法的错误在于, 在循环初始化的时候,初始化right=n,也就是采用的是左闭右开区间,而当满足array[middle] > v的条件是, v如果存在的话应该在[left, middle)区间中,但是这里却把right赋值为middle - 1了,这样,如果恰巧middle-1就是查找的元素,那么就会找不到这个元素.

下面给出两个算法, 分别是正确的左闭右闭和左闭右开区间算法,可以与上面的进行比较:

  1 int search2(int array[], int n, int v)
  2
  3 {
  4
  5     int left, right, middle;
  6
  7
  8
  9     left = 0, right = n - 1;
 10
 11
 12
 13     while (left <= right)
 14
 15     {
 16
 17         middle = (left + right) / 2;
 18
 19         if (array[middle] > v)
 20
 21         {
 22
 23             right = middle - 1;
 24
 25         }
 26
 27         else if (array[middle] < v)
 28
 29         {
 30
 31             left = middle + 1;
 32
 33         }
 34
 35         else
 36
 37         {
 38
 39             return middle;
 40
 41         }
 42
 43     }
 44
 45
 46
 47     return -1;
 48
 49 }
 50
 51 /*------------华丽的分割线----------------------------*/
 52
 53 int search3(int array[], int n, int v)
 54
 55 {
 56
 57     int left, right, middle;
 58
 59
 60
 61     left = 0, right = n;
 62
 63
 64
 65     while (left < right)
 66
 67     {
 68
 69         middle = (left + right) / 2;
 70
 71
 72
 73         if (array[middle] > v)
 74
 75         {
 76
 77             right = middle;
 78
 79         }
 80
 81         else if (array[middle] < v)
 82
 83         {
 84
 85             left = middle + 1;
 86
 87         }
 88
 89         else
 90
 91         {
 92
 93             return middle;
 94
 95         }
 96
 97     }
 98
 99
100
101     return -1;
102
103 }  

死循环

上面的情况还只是把边界的其中一个写错, 也就是右边的边界值写错, 如果两者同时都写错的话,可能会造成死循环,比如下面的这个程序:

 1 int search_bad2(int array[], int n, int v)
 2
 3 {
 4
 5     int left, right, middle;
 6
 7
 8
 9     left = 0, right = n - 1;
10
11
12
13     while (left <= right)
14
15     {
16
17         middle = (left + right) / 2;
18
19         if (array[middle] > v)
20
21         {
22
23             right = middle;
24
25         }
26
27         else if (array[middle] < v)
28
29         {
30
31             left = middle;
32
33         }
34
35         else
36
37         {
38
39             return middle;
40
41         }
42
43     }
44
45
46
47     return -1;
48
49 }  

这个程序采用的是左闭右闭的区间.但是,当array[middle] > v的时候,那么下一次查找的区间应该为[middle + 1, right], 而这里变成了[middle, right];当array[middle] < v的时候,那么下一次查找的区间应该为[left, middle - 1], 而这里变成了[left, middle].两个边界的选择都出现了问题, 因此,有可能出现某次查找时始终在这两个范围中轮换,造成了程序的死循环.

溢出

前面解决了边界选择时可能出现的问题, 下面来解决另一个问题,其实这个问题严格的说不属于算法问题,不过我注意到很多地方都没有提到,我觉得还是提一下比较好.

在循环体内,计算中间位置的时候,使用的是这个表达式:

1 middle = (left + right) / 2;  

假如,left与right之和超过了所在类型的表示范围的话,那么middle就不会得到正确的值.

所以,更稳妥的做法应该是这样的。

1 middle = left + (right - left) / 2;  

更完善的算法

前面我们说了,给出的第一个算法是一个"正确"的程序, 但是还有一些小的问题。

首先, 如果序列中有多个相同的元素时,查找的时候不见得每次都会返回第一个元素的位置, 比如考虑一种极端情况:序列中都只有一个相同的元素,那么去查找这个元素时,显然返回的是中间元素的位置.

其次, 前面给出的算法中,每次循环体中都有三次情况,两次比较,有没有办法减少比较的数量进一步的优化程序?

<<编程珠玑>>中给出了解决这两个问题的算法,结合前面提到溢出问题我对middle的计算也做了修改:

 3 int search4(int array[], int n, int v)
 4
 5 {
 6
 7     int left, right, middle;
 8
 9
10
11     left = -1, right = n;
12
13
14
15     while (left + 1 != right)
16
17     {
18
19         middle = left + (right - left) / 2;
20
21
22
23         if (array[middle] < v)
24
25         {
26
27             left = middle;
28
29         }
30
31         else
32
33         {
34
35             right = middle;
36
37         }
38
39     }
40
41
42
43     if (right >= n || array[right] != v)
44
45     {
46
47         right = -1;
48
49     }
50
51
52
53     return right;
54
55 }  

以上这个最精简

时间: 2024-08-23 02:00:13

#转 二分查找的相关文章

二分查找

递归版(在区间[x, y)中找v的位置) 1 //递归版二分查找 2 int bsearch(int * A, int x, int y, int v) 3 { 4 5 if(v<a[x] || v>a[y-1]) return -1; 6 int m = x + (y-x)/2; //此处能不能用int m = (x+y)/2,需要仔细考虑(暂时想不到原因) 7 if(A[m]==v) return m; 8 else if(A[m]>v) return bsearch(A, x, m

二分查找总结

最近刷leetcode和lintcode,做到二分查找的部分,发现其实这种类型的题目很有规律,题目大致的分为以下几类: 1.最基础的二分查找题目,在一个有序的数组当中查找某个数,如果找到,则返回这个数在数组中的下标,如果没有找到就返回-1或者是它将会被按顺序插入的位置.这种题目继续进阶一下就是在有序数组中查找元素的上下限.继续做可以求两个区间的交集. 2.旋转数组问题,就是将一个有序数组进行旋转,然后在数组中查找某个值,其中分为数组中有重复元素和没有重复元素两种情况. 3.在杨氏矩阵中利用二分查

二分查找JAVA实现

二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好:其缺点是要求待查表为有序表,且插入删除困难.因此,折半查找方法适用于不经常变动而查找频繁的有序列表.首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功:否则利用中间位置记录将表分成前.后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表.重复以上过程,直到找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功. 一.概念 二分查

rwkj 1430 二分查找

#include<iostream>using namespace std;int n,k,a[10000]; int binsearch(int low,int high){ int i,len,s;while(low<high) { len=(high+low)/2; for(s=0,i=0;i<n;i++) s+=a[i]/len; if(s>k) low=len+1; else if(s<k) high=len-1; else return len; }}int

uva:10487 - Closest Sums(二分查找)

题目:10487 - Closest Sums 题目大意:给出一组数据,再给出m个查询的数字.要求找到这组数据里的两个数据相加的和最靠近这个查询的数据,输出那两个数据的和. 解题思路:二分查找,这样找到的话,就输出查询的数值,但是要注意找不到的情况:这里最靠近的值不一定是在找不到的时刻的前一次数据,所以要维护最靠近的要查询数的数值. 代码: #include <stdio.h> #include <algorithm> #include <stdlib.h> using

php二分查找

<?php /** * 二分查找:查找一个值在数组中的位置 *@$val:查找的值 *@$arr:操作的数组,前提是按顺序排列 */ header("content-type:text/html;charset = utf-8"); function biary_search($arr,$val){ $num = count($arr); $low = 0; $high = $num - 1; while($low<$high){ $mid = floor(($high-$

二分查找算法的 JavaScript 实现

二分查找在查找[指定值]在[有序]数据中的[位置]时是一种高效的算法. 以下仅提供 ES5 版本. var arr = [0, 2, 4, 27, 28, 54, 67, 74, 75, 79, 86, 97, 289, 290, 678] function binarySearch(arr, val) { var start = 0, end = arr.length - 1; while (start <= end) { var mid = Math.floor((start + end)

深入浅出数据结构C语言版(12)——从二分查找到二叉树

在很多有关数据结构和算法的书籍或文章中,作者往往是介绍完了什么是树后就直入主题的谈什么是二叉树balabala的.但我今天决定不按这个套路来.我个人觉得,一个东西或者说一种技术存在总该有一定的道理,不是能解决某个问题,就是能改善解决某个问题的效率.如果能够先了解到存在的问题以及已存在的解决办法的不足,那么学习新的知识就更容易接受,也更容易理解. 万幸的是,二叉树的讲解是可以按照上述顺序来进行的.那么,今天在我们讨论二叉树之前,我们先来讨论一种情形.一种操作:假设现在有一个数组,数组中的数据按照某

二分查找法

今年是大年初四,晚上闲的没事儿干,在手机上随手写了二分查找法,对有序数组或者循环有序数组都挺管用! public int binarySearch(int []nums,int key){ return binarySearch(nums,key,0,nums.length); } public int binarySearch(int []nums,int key,int left,int right){ int mid = (left + right) / 2; if(left <= rig

二分查找和斐波那契查找

二分查找 说明:查找的数组或列表必须是有序的,若无序,先进行排序 复杂度:时间复杂度 O(log2n),空间复杂度O(n) C++源码(递归和非递归两个版本) #include <iostream> using namespace std; int a[] = { 1, 2, 3, 4, 5, 6, 8 }; int BinarySearch1(int l, int r, int value) { int mid = (l + r) / 2; if (l == r && a[l