介绍:
BFPRT算法解决的问题十分经典,即从某n个元素的序列中选出第k大(第k小)的元素,通过巧妙的分 析,BFPRT可以保证在最坏情况下仍为线性时间复杂度。该算法的思想与快速排序思想相似,当然,为使得算法在最坏情况下,依然能达到o(n)的时间复杂 度,五位算法作者做了精妙的处理。
时间复杂度
O(N)
算法步骤:
1. 将n个元素每5个一组,分成n/5(上界)组。
2. 取出每一组的中位数,任意排序方法,比如插入排序。
3. 递归的调用selection算法查找上一步中所有中位数的中位数,设为x,偶数个中位数的情况下设定为选取中间小的一个。
4. 用x来分割数组,设小于等于x的个数为k,大于x的个数即为n-k。
5. 若i==k,返回x;若i<k,在小于x的元素中递归查找第i小的元素;若i>k,在大于x的元素中递归查找第i-k小的元素。
终止条件:n=1时,返回的即是i小元素。
测试结果:
数组里有10000个随机数, 执行500次后花费的毫秒数
最大毫秒数为208
最小毫秒数为86
平均毫秒数为102
查找失败次数0
疑问:
这里的代码示例耗时过长,高达100ms,比排序获取第k小的数字还慢,不知道哪里出了问题,请大家指教。
代码示例:
<!doctype html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>BFPRT线性查找算法</title> </head> <body> <script> var count = 10000, num = testCount = 500, i, exeCount, exeTimeArr = [], k, failArr = [], sortFn = function(a, b){ return a - b; }, bfprtSearch = function(a, k){ var arrs = [], middle, middleArr = [], middleIndex, sortedArr = [], last, i, j, h, len; if(a.length <= 5){ if(a.length == 1) return a[0]; a.sort(sortFn); return a[k-1]; } // 以5个数字为一组,排序并记录中位数 while(a.length >= 5){ sortedArr = a.splice(0, 5).sort(sortFn); middleArr.push( sortedArr[2] ); arrs.push(sortedArr); } last = a; a = []; groupNum = arrs.length; // 得到排序后的数组 while(arrs.length){ a = a.concat( arrs.shift() ); } a = a.concat(last); //console.log(‘得到排序后的数组‘, a); // 中位数前置 for(i=0,len=middleArr.length;i<len;i++){ middleIndex = i * 5 + 2; a[i] = [ a[middleIndex], a[middleIndex] = a[i] ] [0]; } //console.log(‘中位数前置‘, a); // 获取中位数数组中的中位数 middleArr.sort(sortFn); middleIndex = Math.floor( (len - 1) / 2); middle = middleArr[middleIndex]; //console.log(‘获取中位数数组中的中位数‘, middle); // 根据上一步得到的中位数对数据进行交换 for(i=0,j=a.length-1;j>i;j--){ if(a[j] > middle){ continue; }else{ while(a[i] < middle){ // 小于对比中位数则略过 i++; if(i > j) break; } } if(i > j){ break; }else{ a[j] = [ a[i], a[i] = a[j] ] [0]; // 将小于对比中位数的数前置 } } //console.log(‘根据上一步得到的中位数对数据进行交换‘, a, j, k); h = j + 1; if(h+1 == k){ // 前面有k-1个数,刚好获取到 return middle; }else if(h+1 > k){ // 第k小的数在前段数组里 return bfprtSearch( a.slice(0, h), k ); }else{ // 第N小的数在后段数组里,重置第k小的k值 return bfprtSearch( a.slice(h), k - h); } return a.slice(0, j); }; var body = document.getElementsByTagName(‘body‘)[0]; var log = function(s){ var p = document.createElement(‘p‘); var ps = document.getElementsByTagName(‘p‘); p.innerHTML = s; ps.length ? body.insertBefore(p, ps[0]) : body.appendChild(p); //document.write(s + ‘<br />‘); 破坏文档结构 //firefox下使用console.log并开启firebug会影响执行 } function exeTest( callback ){ function test(){ var cost, startTime, result, arr = [], sortArr, tmp; testCount--; // 构建随机数组 for(i=0;i<count;i++){ arr.push( Math.round(Math.random() * count) ); // 0 - count } k = Math.floor(Math.random() * count) + 1; tmp = arr.slice(0); sortArr = arr.slice(0).sort(sortFn); //console.log(arr); //console.log(sortArr); startTime = + new Date(); result = bfprtSearch(arr, k); //console.log(result == sortArr[k-1], result); if(result != sortArr[k-1]){ tmp.unshift(‘K为‘+ k + ‘!!!‘); failArr.push(tmp); } exeTimeArr.push(cost = new Date() - startTime); //花费的毫秒数 log(‘本次测试查找‘+ (result == sortArr[k-1] ? ‘成功‘ : ‘失败‘) +‘ 第‘+ k +‘小的数,花费 ‘+ cost +‘ 毫秒, 还剩 ‘+ testCount +‘ 次测试‘); if(testCount == 0 && typeof callback == ‘function‘){ callback(); }else{ // 预防浏览器挂起 setTimeout(test, 10); } } test(); } function callback(){ var sum = 0; var result = ‘数组里有‘+ count +‘个随机数, 执行‘+ num +‘次后花费的毫秒数‘ + ‘<br />‘ + ‘最大毫秒数为‘ + Math.max.apply(null, exeTimeArr) + ‘<br />‘ + ‘最小毫秒数为‘ + Math.min.apply(null, exeTimeArr) + ‘<br />‘; exeTimeArr.forEach(function(value) { sum += value; }) result += ‘平均毫秒数为‘ + Math.round( sum / num ) + ‘<br />‘ ; result += ‘查找失败次数‘ + failArr.length ; if(failArr.length){ result += ‘<br />失败的数组为:<br />‘; failArr.forEach(function(data){ result += data.join(‘,‘) + ‘<br />‘; }) } log(result); } // 开始测试 exeTest(callback); </script> </body> </html>
BFPRT线性查找算法
时间: 2024-11-29 07:44:53