【算法】如何用随机函数rand5来构造随机函数rand7

常规方法

  • 今天公司有一个面试题是这样的:假如有一个函数rand5能等概率生成1 - 5 之间的整数,如何利用rand5来实现rand7?rand7函数的要求是能够等概率生成1 - 7之间的整数。说实话我自己也不是很清楚。
  • 这个问题很经典的。carreercup那本书上有个常见的解法,我记得算法大概是这样的,用PHP写写吧:
01 echo ‘rand7
= ‘
.rand7();
02  
03 function rand7()
04 {
05     while (true)
06     {
07         //得出[0,24]的平均分布
08         $i =
5 * (rand5() - 1) + (rand5() - 1);
09         //只取前21个,
前21个也是平均分布,然后mod 7
10         if$i <
21 )
11         {
12             return $i %
7 + 1;
13         }
14     }
15 }
  • 这么写是什么意思呢?
  • 两次使用rand5(),可以生成1-25的所有数。5 * (rand5() - 1) 可以生成 0 - 20,而后面的则可以生成0 - 4。用数学表达的话就是 [0, 24]。
  • [0, 24] 范围内生成的随机数$i如果大于21,就用 while (true) 重新生成。当$i < 21的时候,就可以用模运算了。
  • 明白了。当 $i < 21的时候,模 7 的结果是 0-6,加1就可以修正为 1-7,这样就可以通过rand5来实现rand7了。

算法的一些释疑

  • 话说得出[0,24]的平均分布的 $i = 5 * (rand5() - 1) + (rand5() - 1); 为什么要这么写呢?为什么不能直接 $i = 6 * (rand5() - 1) ?
  • rand5()产生的是[1,5]的均匀分布,但是有没有发现最后产生的rand7()却是[0,6]的,那么平均分布是如何实现的呢?
  • 5*(rand5()-1) 生成的是 0, 5,10,15,20各20%的概率,rand5()-1 是0,1,2,3,4各20%概率,两者相加,就是0-24各1/25的概率,这样就保证了平均分布的问题了。基本的概率和排列组合问题了。
  • 前21个也是平均分布,那么我取 $i < 14 也可以么?这样也能保证平均分布吗?
  • 应该也可以,但是增加了可能的循环次数。你看到 while (true) 这行代码吗?当while里面的条件不满足,循环就会一直下去。所以从程序上考虑,就是用了21而非14吧。

晚些时候

  • 我Google了下,貌似还有其它思路。先用2个rand5产生rand10(注意,不是相加),然后从rand10产生rand7。
01 //
Gen 0, 1 equal probability
02 int rand01()
03 {
04     int i
= rand5();
05     while (i
> 4) {i = rand5();}
06     return i
% 2;
07 }
08   
09 //
Gen 0, 1, 2, 3, 4, 5, 6, 7 equal probability
10 int rand07()
11 {
12     return rand01()
<< 2 + rand01() << 1 + rand01();
13 }
14   
15 //
Gen 1, 2, 3, 4, 5, 6, 7 equal probability
16 int rand7()
17 {
18     int i
= rand07();
19     while (i
== 0) {i = rand07();}
20     return i;
21 }
  • 还有一种方法,可以直接把概率问题转化到矩阵中解决。
01 int matrix[5][5];
02   
03 memset(matrix,
0, 
sizeof(matrix));
04   
05 //
Set matrix with num 1-7, each num has the same count.
06 for (int i
= 1; i <= 7; ++i)
07 {
08     for (int j
= 0; j < 3; ++j)
09     {
10         *matrix++
= i;
11     }
12 }
13   
14 int rand7()
15 {
16     int i;
17   
18     do
19     {
20         i
= matrix[rand5() - 1][rand5() - 1];
21     while (i
== 0);
22   
23     return i;
24 }
  • 你还真好学。。

通过这个面试题学到了等概率问题的各种解法,可以从把数从二进制角度看,可以用公式拼接出更大的等概率值域空间,也可以直接把概率问题转化到矩阵中解决。

rand5() 它能够等概率生成 1-5 之间的整数。所谓等概率就是1,2,3,4,5 生产的概率均为 0.2 。现在利用rand5(), 构造一个能够等概率生成 1- 7 的方法。 这里有两个特别重要的点,一是 如果 rand5() + rand5(), 我们能够产生一个均匀分布的 1 - 10 吗? 答案是否定的。比如对于 6来讲(4+2, 2+4, 3+3),它被生成的生成的概率比1 (1+0,0+1)要大。

第二个点就是我们不可能用rand5()直接产生 1- 7 的数,不管你用加减乘除都不行。所以,我们要构造一个更大的范围,使得范围里每一个值被生成的概率是一样的,而且这个范围是7的倍数。

先产生一个均匀分布的 0, 5, 10, 15, 20的数,再产生一个均匀分布的 0, 1, 2, 3, 4 的数。相加以后,会产生一个 0到24的数,而且每个数(除0外)生成的概率是一样的。我们只取
1 - 21 这一段,和7 取余以后+1就能得到完全均匀分布的1-7的随机数

时间: 2024-08-01 23:52:15

【算法】如何用随机函数rand5来构造随机函数rand7的相关文章

FP-Growth算法python实现之 FP-tree的构造

本文主要介绍FP-tree的构造算法.上接:FP-Growth算法python实现. tree_builder.py代码: #coding=utf-8 import tree_building class Tree_builder(object): """tree_builder类. 作用:根据事务数据集进行数据准备及构造树.""" def __init__(self, routines, min_sup=-1, counts=[], heade

如何用几何作图法构造阿基米德双子圆

背景 这个作图有些繁琐,只是做备忘之用. 参考资料 可以自行下载PDF版本 具体内容 看上去很简单 左上图: 相切的两个双子圆的半径的构造,其半径恰好是CQ线段的长度; 右上图: 构造两个小半圆的半径和双子圆半径之和用于确定圆心位置 左下和右下, 确定出圆心的位置, 根据已知的半径作图. 所谓"Euclidean construction"直译欧几里德构造作图, 实际"尺规作图".不知道谁这么翻译的,很有意思. 证明在参考文献中已经有.可以自行参考. 做成Geoge

斐波那契算法的对数解法 计算机程序的构造和解释 习题1.19

程序由Scheme语言编写,待会上别的语言实现. #lang racket ;斐波那契对数法 ;筛选 (define (fib n) (fib-iter 1 0 0 1 n)) (define (square x) (* x x)) (define (fib-iter a b p q count) (cond ((= count 0) b);count = 0时,fib(1) = 0 ((even? count);如果是偶数,那么,p,q的值分别为 ;p = p^2 + q^2 ;q = 2pq

一道随机函数题:由rand5()生成rand7()

题目:已知rand5()函数能随机等概率的生成0, 1, 2, 3, 4,利用rand5()函数编写一个rand7()函数实现相似的功能. 分析:其实就是利用rand5()组合成一个更大范围的数,之后利用求余(%)再映射到0-6之间. Java代码: int rand7() { //已知rand5()产生0,1,2,3,4,求rand7() int a; do { a = 5*rand5() + rand5(); //产生0-24 } while (a > 20); //只取0-20 retur

新型随机函数——乱排函数的制作

新型随机函数和以往的随机函数一样的地方是:使用时需要首先设置种子,每次调用得到一个数据,输出的是一些乱码. 不同之处是这种随机函数输出的数据之间是没有关联的,你不能用连续几个输出值推算其计算公式,这是因为它生成方式所致,它没有公式你也推导不出来. 以往的随机函数是由算式生成的,所以它的数据是由算法关联起来的,可能是线性关联甚至高维度的关联. 新函数是采用构造法生成随机数的,现在基本数据是字节,别的结构可以用字节来组合,所以就单说以字节为单位的随机函数,它的元素是 0至 255共256个,构造法是

随机函数Surprising

之前写了个用来抽取1-54号的随机函数,发现30-40出现的情况很大,就在果壳上提问了一下//听取了某个大神的建议循环了10000次之后惊喜的发现这样写出现了一大堆相同的数字!之后有个很神大牛解答了一下//这里mark一下[感谢....][简直长知识了...原来随机函数如此神]随机函数Surprising,码迷,mamicode.com

基础算法思想(二)

分治算法 使用分治法设计程序时,一般可按以下步骤进行: (1)分解:将要求解的问题划分成若干规模较小的同类问题 (2)求解:当子问题划分得足够小时,用较简单的方法解决 (3)合并:按求解问题的要求,将子问题的解逐层合并,即可构成最终的解 分治算法实例(乒乓球比赛赛程安排): 我们要给八个人安排赛程 每个人都要对战 并在七天全部比完 我们可以先把它分成一半 也就是分解这个过程 然后再分解 这时候 这已经分得最小了 那么也只有这么一种安排 也就是 求解 那么回到上一步 也就是合并 再把这一步往上 那

【转载】聚类算法小结

聚类算法总结:---------------------------------------------------------聚类算法的种类: 基于划分聚类算法(partition clustering) k-means: 是一种典型的划分聚类算法,它用一个聚类的中心来代表一个簇,即在迭代过程中选择的聚点不一定是聚类中的一个点,该算法只能处理数值型数据 k-modes: K-Means算法的扩展,采用简单匹配方法来度量分类型数据的相似度 k-prototypes: 结合了K-Means和K-M

机器学习(九)—FP-growth算法

本来老师是想让我学Hadoop的,也装了Ubuntu,配置了Hadoop,一时间却不知从何学起,加之自己还是想先看点自己喜欢的算法,学习Hadoop也就暂且搁置了,不过还是想问一下园子里的朋友有什么学习Hadoop好点的资料,求推荐~言归正传,继Apriori算法之后,今天来学习FP-growth算法. 和Apriori算法相比,FP-growth算法只需要对数据库进行两次遍历,从而高效发现频繁项集.对于搜索引擎公司而言,他们需要通过查看互联网上的用词来找出经常在一块出现的词对,因此这些公司就需