随机选择算法

　　随机选择算法和快速排序原理相似，所以有时候也称作“快速选择算法”，一般选择问题可以证明都能在O(n)时间内完成。随机选择算法的期望运行时间为线性时间，即Θ(n)，但其最坏情况运行时间为O(n^2)。最坏情况与快排一样，都是运气不好导致划分不均匀。

　　代码：

#include "stdafx.h"
#include <iostream>
#include <vector>
#include <stdlib.h>

class QuicklySelect {
public:
	template<class T>
	void swap(T & a, T & b)
	{
		T tem = a;
		a = b;
		b = tem;
	}

	int Partition(std::vector<int> & nums, int start, int end)
	{
		int tem = nums[end];
		int i = start - 1;
		for (int j = start; j < end; j++)
		{
			if (nums[j] <= tem)
			{
				i += 1;
				swap(nums[i], nums[j]);
			}
		}
		swap(nums[i + 1], nums[end]);
		return i + 1;
	}

	int RandomizedPartition(std::vector<int> & nums, int start, int end)
	{
		int i =  start + rand() % (end - start);
		swap(nums[i], nums[end]);
		return Partition(nums, start, end);
	}

	int RandomizedSelect(std::vector<int> & nums, int start, int end, int i)
	{
		if (nums.empty())	return 0;
		if (start == end)	return nums[start];
		int mid = RandomizedPartition(nums, start, end);
		int k = mid - start + 1;
		if (i == k)
			return nums[mid];
		else if (i < k)
			return RandomizedSelect(nums, start, mid - 1, i);
		else
			return RandomizedSelect(nums, mid + 1, end, i - k);
	}
};

int main()
{
	std::vector<int> nums { 5,3,1,4,2 };//5 3 1 2 4

	std::cout << "结果:" << QuicklySelect().RandomizedSelect(nums, 0, nums.size() - 1, nums.size() + 1 - 2) << std::endl;

	getchar();
	return 0;
}

　　运行结果：

　　即4是数组中第2大，第4小的数。

　　算法题：给定一个大小为n的一维无序数组，从数组中找出前k个最大数，最佳时间复杂度是多少？实际应用中我能想到比如网易云的听歌排行榜会列举出听歌次数最多的前100首歌曲。

　　这个题我是在刷知乎时看到的，但找不到那个问题了...若不要求对top k 进行排序，则利用随机选择算法可使期望运行时间达到Θ(n)，空间复杂度O(k)；若排序则运行时间为Θ(n + klogk)，当最坏情况为找所有最大数并排序时，就是排序了，利用快排则时间复杂度为Θ(nlgn)

　　代码：

#include "stdafx.h"
#include <iostream>
#include <vector>
#include <stdlib.h>

class QuicklySelect {
public:
	template<class T>
	void swap(T & a, T & b)
	{
		T tem = a;
		a = b;
		b = tem;
	}

	int Partition(std::vector<int> & nums, int start, int end)
	{
		int tem = nums[end];
		int i = start - 1;
		for (int j = start; j < end; j++)
		{
			if (nums[j] <= tem)
			{
				i += 1;
				swap(nums[i], nums[j]);
			}
		}
		swap(nums[i + 1], nums[end]);
		return i + 1;
	}

	int RandomizedPartition(std::vector<int> & nums, int start, int end)
	{
		int i =  start + rand() % (end - start);
		swap(nums[i], nums[end]);
		return Partition(nums, start, end);
	}

	int RandomizedSelect(std::vector<int> & nums, int start, int end, int i)
	{
		if (nums.empty())	return 0;
		if (start == end)	return nums[start];
		int mid = RandomizedPartition(nums, start, end);
		int k = mid - start + 1;
		if (i == k)
			return nums[mid];
		else if (i < k)
			return RandomizedSelect(nums, start, mid - 1, i);
		else
			return RandomizedSelect(nums, mid + 1, end, i - k);
	}

	std::vector<int> Top(std::vector<int> nums, int k)
	{
		std::vector<int> top;
		top.push_back(RandomizedSelect(nums, 0, nums.size() - 1, nums.size() + 1 - k));
		for (int i = 0; i < nums.size(); i++)
		{
			if (nums[i] > top[0])
				top.push_back(nums[i]);
		}

		return top;
	}

};

int main()
{
	std::vector<int> nums { 5345,332,2341,498,248,89,239,4825,8,43,9892,872,1843 };
	std::vector<int> top = QuicklySelect().Top(nums, 5);

	for (int i = top.size() - 1; i >= 0; i--)
		std::cout << "top" << top.size() - i << ‘:‘ << top[i] << std::endl;

	getchar();
	return 0;
}

　　记得知乎大多数同学使用的是建最大堆的方法，时间复杂度为O(nlgk)，空间复杂度为O(k)，时间复杂度应该还可以优化。

原文地址：https://www.cnblogs.com/darkchii/p/8534836.html

时间： 2024-10-12 13:45:38

随机选择算法

随机选择算法的相关文章

算法系列笔记2(静态表顺序统计-随机选择算法)

Randomize select algorithm 随机选择算法

线性选择算法（未完成）

Bagging与随机森林算法原理小结

R语言︱决策树族——随机森林算法

带权随机数问题--根据权重随机选择一条路径

随机森林算法过程及分析

第九章中位数和顺序统计量 9.2 期望为线性时间的选择算法

我的游戏服务器类库 -- 按权重随机选择1个或n个对象