【编程题目】查找最小的 k 个元素

5.查找最小的 k 个元素(数组)
题目:输入 n 个整数,输出其中最小的 k 个。
例如输入 1,2,3,4,5,6,7 和 8 这 8 个数字,则最小的 4 个数字为 1,2,3 和 4。

算法里面学过查找第k小的元素的O(n)算法

试着实现了一下:

注意new 初始化二维数组的方式

int (* a)[5] = new int[8][5];
/*
5.查找最小的 k 个元素(数组)
题目:输入 n 个整数,输出其中最小的 k 个。
例如输入 1,2,3,4,5,6,7 和 8 这 8 个数字,则最小的 4 个数字为 1,2,3 和 4。
*/

#include <iostream>
#include <algorithm>
using namespace std;

bool compare(int a, int b) //降序排列
{
    return a > b;
}

//找到 一共有 n个 元素的 数组S 中 第k小 的数字  整个算法中,对除以5后余下的数字都做了特殊处理
int Select(int * S, int k, int n)
{
    if (n < 5) //对少于5个的做特殊处理
    {
        sort(S, S + n);
        return S[k - 1];
    }
    int subn = n/5 + ((n % 5 == 0) ? 0 : 1);
    int subnn = n/5;
    int (* subS)[5] = new int[subn][5];
    for (int i = 0; i < subnn; i++)
    {
        for (int j = 0; j < 5; j++)
        {
            subS[i][j] = S[i * 5 + j];
        }
        sort(subS[i], subS[i] + 5, compare); //5个一组,每组从大到小排序
    }
    for (int j = 0; j < n % 5; j++)
    {
        subS[subn - 1][j] = S[subn * 5 + j - 5];
    }
    sort(subS[subn - 1], subS[subn - 1] + n % 5, compare); 

    int * M = new int [subn];
    for (int i = 0; i < subn; i++)
    {
        M[i] = subS[i][2]; //M 中存储每组数字的中位数
    }

    int Mn = subnn;
    int m = Select(M, Mn/2 + (Mn % 2 == 0) ? 0 : 1, Mn);
    delete [] M;

    int * S1 = new int [n]; //存放小于等于m的数字
    int * S2 = new int [n];
    int S1n = 0; //记录有多少小于等于m的数字
    int S2n = 0;

    //找到相应的S1 与 S2中的元素
    for (int i = 0; i < subnn; i++)
    {
        if (subS[i][2] <= m)
        {
            for (int j = 0; j < 5; j++)
            {
                if (j < 2)
                {
                    if (subS[i][j] <= m)
                    {
                        S1[S1n++] = subS[i][j];
                    }
                    else
                    {
                        S2[S2n++] = subS[i][j];
                    }
                }
                else
                {
                    S1[S1n++] = subS[i][j];
                }
            }
        }
        else
        {
            for (int j = 0; j < 5; j++)
            {
                if (j > 2)
                {
                    if (subS[i][j] <= m)
                    {
                        S1[S1n++] = subS[i][j];
                    }
                    else
                    {
                        S2[S2n++] = subS[i][j];
                    }
                }
                else
                {
                    S2[S2n++] = subS[i][j];
                }
            }
        }
    }
    if (subnn != subn) //多余的数字特别处理
    {
        for (int j = 0; j < n % 5; j++)
        {
            if (subS[subn - 1][j] > m)
            {
                S2[S2n++] = subS[subn - 1][j];
            }
            else
            {
                S1[S1n++] = subS[subn - 1][j];
            }
        }
    }

    if (k == S1n)
    {
        delete [] S1;
        delete [] S2;
        return m;
    }
    else if (k < S1n)
    {
        return Select(S1, k, S1n);
    }
    else
    {
        return Select(S2, k - S1n, S2n);
    }

    delete [] S1;
    delete [] S2;
}

int main()
{
    int a[8] = {1,2,3,4,5,6,7,8};
    int m = Select(a, 7, 8);

    return 0;
}

不过,我的代码看起来好长,好难受啊...

网上有用堆做的,对堆不是很了解,要补一下知识。

看了用堆的方法的原理,理论上会比我现在实现的这个算法慢一点

方法是用堆维护k个最小元素

下面来自:https://github.com/julycoding/The-Art-Of-Programming-By-July/blob/master/ebook/zh/02.01.md

解法二

咱们再进一步想想,题目没有要求最小的k个数有序,也没要求最后n-k个数有序。既然如此,就没有必要对所有元素进行排序。这时,咱们想到了用选择或交换排序,即:

1、遍历n个数,把最先遍历到的k个数存入到大小为k的数组中,假设它们即是最小的k个数;
2、对这k个数,利用选择或交换排序找到这k个元素中的最大值kmax(找最大值需要遍历这k个数,时间复杂度为O(k));
3、继续遍历剩余n-k个数。假设每一次遍历到的新的元素的值为x,把x与kmax比较:如果x < kmax ,用x替换kmax,并回到第二步重新找出k个元素的数组中最大元素kmax‘;如果x >= kmax,则继续遍历不更新数组。

每次遍历,更新或不更新数组的所用的时间为O(k)O(0)。故整趟下来,时间复杂度为n*O(k)=O(n*k)

解法三

更好的办法是维护容量为k的最大堆,原理跟解法二的方法相似:

  • 1、用容量为k的最大堆存储最先遍历到的k个数,同样假设它们即是最小的k个数;
  • 2、堆中元素是有序的,令k1<k2<...<kmax(kmax设为最大堆中的最大元素)
  • 3、遍历剩余n-k个数。假设每一次遍历到的新的元素的值为x,把x与堆顶元素kmax比较:如果x < kmax,用x替换kmax,然后更新堆(用时logk);否则不更新堆。

这样下来,总的时间复杂度:O(k+(n-k)*logk)=O(n*logk)。此方法得益于堆中进行查找和更新的时间复杂度均为:O(logk)(若使用解法二:在数组中找出最大元素,时间复杂度:O(k))

堆的实现代码:来自http://www.cnblogs.com/panweishadow/p/3632639.html

public static void FindKMin(int[] sort, int k)
{
    int[] heap = sort;
    int rootIndex = k / 2 - 1;
    while (rootIndex >= 0)
    {
        reheap(heap, rootIndex, k - 1);
        rootIndex--;
    }

    for (int i = k, len=heap.Length; i < len; i++)
    {
        if (heap[i]<heap[0])
        {
            heap[0] = heap[i];
            reheap(heap, 0, k - 1);
        }
    }

    Console.WriteLine("The {0} min element =",k);
    for (int i = 0; i < k; i++)
    {
        Console.Write(heap[i] + " ");
    }
}

private static void reheap(int[] heap, int rootIndex, int lastInddex)
{
    int orphan = heap[rootIndex];
    bool done = false;
    int leftIndex = rootIndex * 2 + 1;
    while (!done && leftIndex <= lastInddex)
    {
        int largerIndex = leftIndex;
        if (leftIndex+1 <= lastInddex)
        {
            int rightIndex = leftIndex + 1;
            if (heap[rightIndex] > heap[leftIndex])
            {
                largerIndex = rightIndex;
            }
        }

        if (orphan < heap[largerIndex])
        {
            heap[rootIndex] = heap[largerIndex];
            rootIndex = largerIndex;
            leftIndex = rootIndex * 2 + 1;
        }
        else
        {
            done = true;
        }
    }

    heap[rootIndex] = orphan;
}
时间: 2024-11-05 21:48:37

【编程题目】查找最小的 k 个元素的相关文章

5.查找最小的k个元素

http://zhedahht.blog.163.com/blog/static/2541117420072432136859/ http://blog.csdn.net/liangbopirates/article/details/9377105 http://blog.csdn.net/v_JULY_v/article/details/6370650 题目:输入n个整数,输出其中最小的k个. 例如输入1,2,3,4,5,6,7和8这8个数字,则最小的4个数字为1,2,3和4. 分析: 这道题

查找最小的k个元素

题目: 输入n个整数,输出其中最小的k个数 例如: 1 2 3 4 5 6 7 8 这8个数字,则最小的4个数字为1,2,3,4, 第一种:直接对其先排序,再取头几个数 这样最快是nlogn(快排或者堆排) #include <iostream> using namespace std; void partsort(int a[], int l, int r); void QuickSort(int a[], int n) { partsort(a,0,n-1); } void partsor

排序,求几个最值问题,输入n个整数,输出其中最小的k个元素。

看完两个求最大值算法之后的一些感想. 如果想直接看算法的可以跳过.但是我觉得我这些想法还是比较有用的,至少对我将来的算法设计是这样的. 算法的功能越强大,必然意味着速度慢,因为根据丛林法则,那种慢又功能少的算法会被淘汰. 所以,(注意了!!),如果我们在使用一个算法的时候感觉到它造成的结果满足我们的使用,而且超出了,我们的使用,那么我们就很可能浪费了时间,降低了效率. 例如这个1000个数中求最大的10个的算法: 如果排序,取前10个.发现后面的白排序了,根本没用到.参照加粗行,也许可以有更快的

【剑指offer】 堆排序查找最小的K个数

上一篇 说了些堆的建立及其相关操作,这里看下用堆来解决数据量较大的时候,查找最小的k个数的情况.这里会用到上一篇中的函数. 我们先生存1千万个随机数,写到文件中: import random def randData(): with open('randint.txt', 'w') as fd: for i in range(1, 10000000): fd.write('%d ' %random.randint(1, 100)) if i % 100 == 0: fd.write('\r')

IT公司100题-5-查找最小的k个元素

问题描述: 输入n 个整数,输出其中最小的k 个. 例如输入8, 7, 6, 5, 4, 3, 2, 1这8 个数字,则最小的3 个数字为3, 2, 1. 问题分析: 时间复杂度O(nlogn)方法: 对n个整数升序排序,取数组前面k个数就是最小的k个数,时间复杂度为O(nlogn),空间复杂度为O(1). 大顶堆,时间复杂度为O(nlogk): 我们可以采用大顶堆来保存最小的k个数,堆顶元素就是k个最小的数中最大的.新来一个元素的时候,与堆顶元素进行比较,如果比堆顶元素大,则直接丢弃.如果比堆

求最小的k个元素

题目: 输入n个整数,输出其中最小的k个. 例如:1,2,3,4,5,6,7,8 则最小的4个数为1,2,3,4, #include<iostream> using namespace std; class MinK{ public: MinK(int *arr, int si) :array(arr), size(si){} bool kmin(int k, int* &ret) { if (k > size) { ret = NULL; return false; } els

【目录】编程题目

编程题目 如何对n个数进行排序,要求时间复杂度O(n),空间复杂度O(1) 一个数组是由一个递减数列左移若干位形成的,在这种数组中查找某一个数.☆ 请修改 append 函数,利用这个函数实现两个非降序链表的并集 一串首尾相连的珠子(m 个),有 N 种颜色(N<=10),取出其中一段,要求包含所有 N 中颜色,并使长度最短. 求一个有向连通图的割点,割点的定义是,如果除去此节点和与其相关的边, 有向图不再连通 有 n 个长为 m+1 的字符串,如果某个字符串的最后 m 个字符与某个字符串的前

寻找最小的k个数(大顶堆方法)

题目描述:查找最小的k个元素,输入n个整数,输出其中最小的k个. 一般的排序方法,如快排,时间复杂度为O(n*logn+k); 大顶堆方法,时间复杂度为O(k+(n-k)*logk); 如果建立k个元素的最小堆的话,那么其空间复杂度势为O(N),而建立k个元素的最大堆的空间复杂度为O(k); 当面对海量数据处理的时候,大顶堆的方法是较为靠谱的,并且可以在面试时短时间内完成代码. 1 class Solution { 2 public: 3 void Swap(int &a,int &b)

C语言强化(五)输出一串数中最小的 k 个

有时候题目看似很简单,似乎非常容易实现,但是,你考虑过效率了吗? 通过这道题,你可以掌握 简单的插入排序 算法最优化的技巧 题目:输入 n 个整数,输出其中最小的 k 个. 例如输入 1,2,3,4,5,6,7 和 8 这 8 个数字,则最小的 4 个数字为 1,2,3 和 4. 看到此题,第一反应就是对这串数字进行排序,然后遍历角标0~3的数字打印出来,很简单嘛~~ 怎么可以这么简单,仔细一看,题目只是要求最小的N个数字啊,这样子对整个数组进行排序有必要吗? 只需要4个最小的,也就意味着只要一