二分查找实现(Jon Bentley:90%程序员无法正确实现)

二分查找实现(Jon Bentley:90%程序员无法正确实现)
作者:July
出处:结构之法算法之道
引言
Jon Bentley:90%以上的程序员无法正确无误的写出二分查找代码。也许很多人都早已
听说过这句话,但我还是想引用《编程珠玑》上的如下几段文字:
“二分查找可以解决(预排序数组的查找)问题:只要数组中包含T(即要查找的值),
那么通过不断缩小包含T 的范围,最终就可以找到它。一开始,范围覆盖整个数组。将数
组的中间项与T 进行比较,可以排除一半元素,范围缩小一半。就这样反复比较,反复缩
小范围,最终就会在数组中找到T,或者确定原以为T 所在的范围实际为空。对于包含N
个元素的表,整个查找过程大约要经过log(2)N 次比较。
多数程序员都觉得只要理解了上面的描述,写出代码就不难了;但事实并非如此。如果
你不认同这一点,最好的办法就是放下书本,自己动手写一写。试试吧。
我在贝尔实验室和IBM 的时候都出过这道考题。那些专业的程序员有几个小时的时间,
可以用他们选择的语言把上面的描述写出来;写出高级伪代码也可以。考试结束后,差不多
所有程序员都认为自己写出了正确的程序。于是,我们花了半个钟头来看他们编写的代码经
过测试用例验证的结果。几次课,一百多人的结果相差无几:90%的程序员写的程序中有
bug(我并不认为没有bug 的代码就正确)。
我很惊讶:在足够的时间内,只有大约10%的专业程序员可以把这个小程序写对。但
写不对这个小程序的还不止这些人:高德纳在《计算机程序设计的艺术第3 卷排序和查
找》第6.2.1 节的“历史与参考文献”部分指出,虽然早在1946 年就有人将二分查找的方法
公诸于世,但直到1962 年才有人写出没有bug 的二分查找程序。”——乔恩·本特利,《编
程珠玑(第1 版)》第35-36 页。
你能正确无误的写出二分查找代码么?不妨一试。
348
二分查找代码
二分查找的原理想必不用多解释了,不过有一点必须提醒读者的是,二分查找是针对的
排好序的数组。OK,纸上读来终觉浅,觉知此事要躬行。我先来写一份,下面是我写的一
份二分查找的实现(之前去某一家公司面试也曾被叫当场实现二分查找,不过结果可能跟你
一样,当时就未能完整无误写出),有任何问题或错误,恳请不吝指正:
//二分查找V0.1 实现版
//[email protected] July
//随时欢迎读者找bug,email:[email protected]。
//首先要把握下面几个要点:
//right=n-1 => while(left <= right) => right=middle-1;
//right=n => while(left < right) => right=middle;
//middle 的计算不能写在while 循环外,否则无法得到更新。
int binary_search(int array[],int n,int value)
{
int left=0;
int right=n-1;
//如果这里是int right = n 的话,那么下面有两处地方需要修改,以保证一一对应:
//1、下面循环的条件则是while(left < right)
//2、循环内当array[middle]>value 的时候,right = mid
while (left<=right) //循环条件,适时而变
{
int middle=left + ((right-left)>>1); //防止溢出,移位也更高效。同时,每次循环
都需要更新。
if (array[middle]>value)
{
right =middle-1; //right 赋值,适时而变
}
else if(array[middle]<value)
{
left=middle+1;
}
else
return middle;
//可能会有读者认为刚开始时就要判断相等,但毕竟数组中不相等的情况更多
//如果每次循环都判断一下是否相等,将耗费时间
}
return -1;
349
}
简单测试下,运行结果如下所示(当然,一次测试正确不代表程序便0 bug 了,且测试
深度远远不够):
测试
也许你之前已经把二分查找实现过很多次了,但现在不妨再次测试一下。关闭所有网页,
窗口,打开记事本,或者编辑器,或者直接在本文评论下,不参考上面我写的或其他任何人
的程序,给自己十分钟到N 个小时不等的时间,立即编写一个二分查找程序。独立一次性
正确写出来后,可以留下代码和邮箱地址,我给你传一份本blog 的博文集锦CHM 文件&&
十三个经典算法研究带标签+目录的PDF 文档(你也可以去我的资源下载处下载:
http://download.csdn.net/user/v_july_v)。
350
当然,能正确写出来不代表任何什么,不能正确写出来亦不代表什么,仅仅针对Jon
Bentley 的言论做一个简单的测试而已。下一章,请见第二十六章:基于给定的文档生成倒
排索引的编码与实践。谢谢。
总结
本文发表后,马上就有很多朋友自己尝试了。根据从朋友们在本文评论下留下的代码,
发现出错率最高的在以下这么几个地方:
1. 注释里已经说得很明白了,可还是会有不少朋友犯此类的错误:
1. //首先要把握下面几个要点:
2. //right=n-1 => while(left <= right) => right=middle-1;
3. //right=n => while(left < right) => right=middle;
4. //middle 的计算不能写在while 循环外,否则无法得到更新。
2. 还有一个最最常犯的错误是@土豆:
middle= (left+right)>>1; 这样的话left 与right 的值比较大的时候,其和可能溢出。
各位继续努力。
updated:各位,可以到此处0 积分下载本blog 最新博文集锦第6 期CHM 文件:
http://download.csdn.net/detail/v_july_v/4020172。

时间: 2024-10-18 22:19:28

二分查找实现(Jon Bentley:90%程序员无法正确实现)的相关文章

page61-将二分查找重写为一段面向对象的程序

1 将二分查找重写为一段面向对象的程序 (用于在整数集合中进行查找的一种抽象数据类型) public class StaticSETofInts [API] StaticSETofInts(int[] a )根据 a[]中的所有值创建一个集合 boolean contains(int key) key是否存在于集合中. [数据实现] import java.util.Arrays; public class StaticSETofInts { private int[] a; public St

程序员如何正确的评估自己的薪资

十一大假过完已有多半月之久,往往这时候是又到了今年最后一个黄金跳槽节点了,跳与不跳,能力就在那里,工作就在那里,薪资也就在那里!这次和大家聊聊程序员的薪资问题.看看能不能引起你的共鸣! 价值的构成 程序员的价值,简单的说就是薪资,并不是由你觉得自己应该值多少钱来定的,而是由招聘方觉得你值多少钱来决定的.影响招聘方定价最重要的三个方面分别是:1.供需2.增幅3.价值 如下分析: 1.价值 在理想情况下,个人薪资是由你给公司带来的价值决定的.这和你自己NB不NB没有直接关系,很多程序员觉得"我那么N

「mysql优化专题」90%程序员面试都用得上的索引优化手册(5)

目录(技术文) 多关于索引,分为以下几点来讲解: 一.索引的概述(什么是索引,索引的优缺点) 二.索引的基本使用(创建索引) 三.索引的基本原理(面试重点) 四.索引的数据结构(B树,hash) 五.创建索引的原则(重中之重,面试必问!敬请收藏!) 六.百万级别或以上的数据如何删除 一.索引的概述 1)什么是索引? 索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分),它们包含着对数据表里所有记录的引用指针.更通俗的说,索引就相当于目录.当你在用新华字典时,帮你把目录撕掉了,

「mysql优化专题」90%程序员没听过的存储过程和存储函数教学(7)

一.MYSQL储存过程简介(技术文): 储存过程是一个可编程的函数,它在数据库中创建并保存.它可以有SQL语句和一些特殊的控制结构组成.当希望在不同的应用程序或平台上执行相同的函数,或者封装特定功能时,存储过程是非常有用的.数据库中的存储过程可以看做是对编程中面向对象方法的模拟.它允许控制数据的访问方式.存储过程通常有以下优点: 1)存储过程能实现较快的执行速度. 如果某一操作包含大量的Transaction-SQL代码或分别被多次执行,那么存储过程要比批处理的执行速度快很多.因为存储过程是预编

吐血总结——90%程序员面试都用得上的索引优化手册

目录 多关于索引,分为以下几点来讲解: 一.索引的概述(什么是索引,索引的优缺点) 二.索引的基本使用(创建索引) 三.索引的基本原理(面试重点) 四.索引的数据结构(B树,hash) 五.创建索引的原则(重中之重,面试必问!敬请收藏!) 六.百万级别或以上的数据如何删除 一.索引的概述 Ⅰ.什么是索引? 索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分),它们包含着对数据表里所有记录的引用指针.更通俗的说,索引就相当于目录.当你在用新华字典时,帮你把目录撕掉了,你查询某个

mysql优化专题」90%程序员都会忽略的增删改优化(2)

补充知识点:操作数据语句优化的认识 通常情况下,当访问某张表的时候,读取者首先必须获取该表的锁,如果有写入操作到达,那么写入者一直等待读取者完成操作(查询开始之后就不能中断,因此允许读取者完成操作).当读取者完成对表的操作的时候,锁就会被解除.如果写入者正在等待的时候,另一个读取操作到达了,该读取操作也会被阻塞(block),因为默认的调度策略是写入者优先于读取者.当第一个读取者完成操作并解放锁后,写入者开始操作,并且直到该写入者完成操作,第二个读取者才开始操作.因此:要提高MySQL的更新/插

android程序员应正确的使用电脑

1.注意养成良好的卫生习惯: 电脑前工作,不宜一边操作电脑一边吃东西,也不宜在操作室内就餐,否则易造成消化不良或胃炎.电脑键盘接触者较多,工作完毕应洗手以防传染病. 2.注意保持皮肤清洁: 应经常保持脸部和手的皮肤清洁,因为电脑荧光屏表面存在着大量静电,其集聚的灰尘可转射到脸部和手的皮肤裸露处,时间久了,易发生难看的斑疹.色素沉着,严重者甚至会引起皮肤病变等. 3.注意补充营养: 电脑前工作时间过长,视网膜上的视紫红质会被消耗掉,而视紫红质主要由维生素A合成.因此,电脑操作者应多吃些胡萝卜.白菜

程序员编程艺术

本书来自一位很有奉献精神的大神July,希望有一天能够看到本书出版. 对作者致以最真诚的感谢! 作者博客 作者微博 本书GitHub地址 CSDN下载链接 百度云盘下载链接 本书目录: 程序员编程艺术第一~三十七章集锦.............................................1 前言........................................................................1 目录................

90%的Java程序员不会的10到Java面试题

先来看看这10道Java面试题你会几道?1.为什么等待和通知是在 Object 类而不是 Thread 中声明的?2.为什么Java中不支持多重继承?3.为什么Java不支持运算符重载?4.为什么 String 在 Java 中是不可变的?5.为什么 char 数组比 Java 中的 String 更适合存储密码?6.如何使用双重检查锁定在 Java 中创建线程安全的单例? 编写 Java 程序时, 如何在 Java 中创建死锁并修复它? 如果你的Serializable类包含一个不可序列化的成