线性时间求取第 K 大数

求 Top K 的算法主要有基于快速排序的和基于堆的这两种,它们的时间复杂度都为 \(O(nlogK)\)。借助于分治思想,以及快速排序的区间划分,我们可以做到 \(O(n)\) 时间复杂度。具体算法思路如下:

  • 第 1 步,我们将原数据 5 个一组划分为若干个组,最后余下的不足 5 个的额外作为一组,总组数为 \(g=\lceil{n/5}\rceil\);
  • 第 2,3 步, 对每一个组内的 5 个元素利用插入排序算法进行排序,然后将每个组的中位数依次放到数据的前面,最后 \(A[0, g-1]\) 保存的便是 \(g\) 个组各自的中位数;
  • 第 4 步,递归调用求出 \(A[0, g-1]\) 的中位数,也即是元素 \(A[g/2]\),不知是否可以直接得到;
  • 第 5 步,以上一步得到的中位数对数据划分区间,左边小于中位数,右边大于中位数,中位数位于第 \(k\) 个位置;
  • 第 6 步,如果我们要找的正好是第 \(k\) 大数,那么刚刚得到的中位数即为所求;
  • 第 7 步,如果 \(i<k\) 我们要找的第 \(i\) 大数位于区间 \(A[0, k-1]\),在左半边递归求取第 \(i\) 大的数;
  • 第 8 步,如果 \(i>k\) 我们要找的第 \(i\) 大数位于区间 \(A[k+1:-1]\),在右半边递归求取第 \(i-k\) 大的数。
def insert_sort(data, left, right):

    # 对列表 data[left, right] 进行插入排序

    for i in range(left+1, right+1):
        num = data[i]
        for j in range(i, left, -1):
            if num < data[j-1]:
                data[j] = data[j-1]
            else:
                break
        data[j] = num

def swap(data, i, j):

    # 交换列表 data 位于 i,j 的元素

    temp = data[i]
    data[i] = data[j]
    data[j] = temp

def partition(data, x):

    # 按照列表 data 第 x 个元素分区

    n = len(data)
    i = 0
    pivot = data[x]
    swap(data, x, n-1)
    for j in range(0, n):
        if data[j] < pivot:
            swap(data, i, j)
            i += 1

    data[j] = data[i]
    data[i] = pivot

    return i

def select_ith_min(data, i):

    # 选取列表 data 中第 i 小的元素

    n = len(data)

    # 不要忘了递归终止
    if n == 1:
        return data[0]

    if n % 5 == 0:
        group = n // 5
    else:
        group = n // 5 + 1
    for j in range(0, group):
        start = j * 5
        end = start + 4
        if end > n - 1:
            end = n - 1
        insert_sort(data, start, end)
        mid = (end - start + 1) // 2 + start
        swap(data, j, mid)

    pivot = data[group // 2]
    k = partition(data, group // 2)

    if k == i-1:
        return pivot
    elif k > i-1:
        return select_ith_max(data[0:k], i)
    else:
        return select_ith_max(data[k:], i-k)

a = [i for i in range(100, 0, -1)]
print(a)
for i in range(1, 101):
    num = select_ith_max(a, i)
    print(num)

获取更多精彩,请关注「seniusen」!

原文地址:https://www.cnblogs.com/seniusen/p/11979903.html

时间: 2024-07-29 21:27:12

线性时间求取第 K 大数的相关文章

[csu/coj 1080]划分树求区间前k大数和

题意:从某个区间内最多选择k个数,使得和最大 思路:首先题目给定的数有负数,如果区间前k大出现负数,那么负数不选和更大,于是对于所有最优选择,负数不会出现,所以用0取代负数,问题便转化为区间的前k大数和. 划分树: [1  6  3  8  5  4  7  2] [6  8  5  7][1  3  4  2] [8  7][6  5][3  4][1  2] [8][7][6][5][4][3][2][1] 把快排的结果从上至下依次放入线段树,就构成了划分树,划分的意思就是选定一个数,把原序

算法导论学习之线性时间求第k小元素+堆思想求前k大元素

对于曾经,假设要我求第k小元素.或者是求前k大元素,我可能会将元素先排序,然后就直接求出来了,可是如今有了更好的思路. 一.线性时间内求第k小元素 这个算法又是一个基于分治思想的算法. 其详细的分治思路例如以下: 1.分解:将A[p,r]分解成A[p,q-1]和A[q+1,r]两部分.使得A[p,q-1]都小于A[q],A[q+1,r]都不小于A[q]; 2.求解:假设A[q]恰好是第k小元素直接返回,假设第k小元素落在前半区间就到A[p,q-1]递归查找.否则到A[q+1,r]中递归查找. 3

[hdu3949]XOR(线性基求xor第k小)

题目大意:求xor所有值的第k小,线性基模板题. #include<cstdio> #include<cstring> #include<algorithm> #include<cstdlib> #include<iostream> #include<cmath> using namespace std; typedef long long ll; const int MAX_BASE=63; ll base[64],a[10006]

[二分法]线性时间内在数组中找出第k大的数

#include "stdafx.h" #include "iostream" using namespace std; //参数为 数组指针,开始下标, 结束下标, 第K大数(k从0开始) int rand_par(int array[], int start, int end, int th){ if( start < 0 || end < 0 || th < 0 || end < start ){ return -1; } int le

POJ 2761 Feed the dogs(树状数组求区间第K大)

题目链接: 戳我 题目大意:Jiajia要为宠物狗,宠物狗按成一排站好(1 < i <= n),第 i 只狗的喜欢程度是 a[i], 之后他会先喂某个区间内第k个 即 n 个数, m个询问,接着是 n个数 接下来 m 行,每行是 l r k即 l 到 r 这个区间第 k 小的数,每个询问输出一个答案,即 a[i] 求区间第k大有很多算法, 详见此博客 [数据结构练习] 求区间第K大数的几种方法 我用的树状数组解法,来自 树状数组从前往后求和,用来解第k大(或小)的数 poj 2985 The

线性时间O(n)内求数组中第k大小的数

--本文为博主原创,转载请注明出处 因为最近做的WSN(wireless sensor network)实验要求用3个传感器节点接受2000个包的数据并算出一些统计量,其中就有算出中位数这么一个要求,且其按算出数据的时间长短排名给分,所以就在考虑一个线性时间的求第k大小的数的算法. 鉴于传感器只有10k的内存,以及考虑到快排的过程利于简化,所以采用快速排序(以及由之前课程中做的排序算法的测试得知,快排在相同时间复杂度的排序中有较大的优越性,最重要的就是快排好写). 算法基本思想 快速排序的思想就

HDU 4006 求第k大数 treap

裸题,瞬秒.. #include <stdio.h> #include <iostream> #include <algorithm> #include <math.h> #include <vector> #include <set> #include <map> #include <queue> using namespace std; #define L(id) tree[id].ch[0] #defin

poj 2985 The k-th Largest Group 求第K大数 Treap, Binary Index Tree, Segment Tree

题目链接:点击打开链接 题意:有两种操作,合并集合,查询第K大集合的元素个数.(总操作次数为2*10^5) 解法: 1.Treap 2.树状数组 |-二分找第K大数 |-二进制思想,逼近第K大数 3.线段树 4.... Treap模板(静态数组) #include <math.h> #include <time.h> #include <stdio.h> #include <limits.h> #include <stdlib.h> const

hdu2852 KiKi&#39;s K-Number 树状数组求第k大数

//再求第k大数时只需要getsum(b-1)<getsum(a)+k<=getsum(b) //b就是a的第k大数 //又gesum(b-1)<=getsum(b)则可以用二分查找来做 #include<iostream> #include<cstdio> #include<cstring> using namespace std; const int maxn=100010; int tree[maxn]; int lowbit(int i) {