【算法】如何用随机函数rand5来构造随机函数rand7

常规方法

今天公司有一个面试题是这样的：假如有一个函数rand5能等概率生成1 - 5 之间的整数，如何利用rand5来实现rand7？rand7函数的要求是能够等概率生成1 - 7之间的整数。说实话我自己也不是很清楚。
这个问题很经典的。carreercup那本书上有个常见的解法，我记得算法大概是这样的，用PHP写写吧：

`01`	`echo` `‘rand7 = ‘.rand7();`

02

`03`	`function` `rand7()`

04 {

`05`	`while` `(true)`

06 {

`07`	`//得出[0,24]的平均分布`

`08`	`$i` `= 5 * (rand5() - 1) + (rand5() - 1);`

`09`	`//只取前21个, 前21个也是平均分布,然后mod 7`

`10`	`if(` `$i` `< 21 )`

11 {

`12`	`return` `$i` `% 7 + 1;`

13 }

14 }

15 }

这么写是什么意思呢？
两次使用rand5()，可以生成1-25的所有数。5 * (rand5() - 1) 可以生成 0 - 20，而后面的则可以生成0 - 4。用数学表达的话就是 [0, 24]。
[0, 24] 范围内生成的随机数$i如果大于21，就用 while (true) 重新生成。当$i < 21的时候，就可以用模运算了。
明白了。当 $i < 21的时候，模 7 的结果是 0-6，加1就可以修正为 1-7，这样就可以通过rand5来实现rand7了。

算法的一些释疑

话说得出[0,24]的平均分布的 $i = 5 * (rand5() - 1) + (rand5() - 1); 为什么要这么写呢？为什么不能直接 $i = 6 * (rand5() - 1) ？
rand5()产生的是[1,5]的均匀分布，但是有没有发现最后产生的rand7()却是[0,6]的，那么平均分布是如何实现的呢？
5*(rand5()-1) 生成的是 0, 5,10,15,20各20%的概率，rand5()-1 是0,1,2,3,4各20%概率，两者相加，就是0-24各1/25的概率，这样就保证了平均分布的问题了。基本的概率和排列组合问题了。
前21个也是平均分布，那么我取 $i < 14 也可以么？这样也能保证平均分布吗？
应该也可以，但是增加了可能的循环次数。你看到 while (true) 这行代码吗？当while里面的条件不满足，循环就会一直下去。所以从程序上考虑，就是用了21而非14吧。

晚些时候

我Google了下，貌似还有其它思路。先用2个rand5产生rand10（注意，不是相加），然后从rand10产生rand7。

`01`	`// Gen 0, 1 equal probability`

`02`	`int` `rand01()`

03 {

`04`	`int` `i = rand5();`

`05`	`while` `(i > 4) {i = rand5();}`

`06`	`return` `i % 2;`

07 }

08

`09`	`// Gen 0, 1, 2, 3, 4, 5, 6, 7 equal probability`

`10`	`int` `rand07()`

11 {

`12`	`return` `rand01() << 2 + rand01() << 1 + rand01();`

13 }

14

`15`	`// Gen 1, 2, 3, 4, 5, 6, 7 equal probability`

`16`	`int` `rand7()`

17 {

`18`	`int` `i = rand07();`

`19`	`while` `(i == 0) {i = rand07();}`

`20`	`return` `i;`

21 }

还有一种方法，可以直接把概率问题转化到矩阵中解决。

`01`	`int` `matrix[5][5];`

02

`03`	`memset(matrix, 0,` `sizeof(matrix));`

04

`05`	`// Set matrix with num 1-7, each num has the same count.`

`06`	`for` `(int` `i = 1; i <= 7; ++i)`

07 {

`08`	`for` `(int` `j = 0; j < 3; ++j)`

09 {

`10`	`*matrix++ = i;`

11 }

12 }

13

`14`	`int` `rand7()`

15 {

`16`	`int` `i;`

17

18 do

19 {

`20`	`i = matrix[rand5() - 1][rand5() - 1];`

`21`	`}` `while` `(i == 0);`

22

`23`	`return` `i;`

24 }

你还真好学。。

通过这个面试题学到了等概率问题的各种解法，可以从把数从二进制角度看，可以用公式拼接出更大的等概率值域空间，也可以直接把概率问题转化到矩阵中解决。

rand5() 它能够等概率生成 1-5 之间的整数。所谓等概率就是1,2,3,4,5 生产的概率均为 0.2 。现在利用rand5(), 构造一个能够等概率生成 1- 7 的方法。这里有两个特别重要的点，一是如果 rand5() + rand5(), 我们能够产生一个均匀分布的 1 - 10 吗？答案是否定的。比如对于 6来讲（4+2， 2+4， 3+3），它被生成的生成的概率比1 （1+0，0+1）要大。

第二个点就是我们不可能用rand5()直接产生 1- 7 的数，不管你用加减乘除都不行。所以，我们要构造一个更大的范围，使得范围里每一个值被生成的概率是一样的，而且这个范围是7的倍数。

先产生一个均匀分布的 0， 5， 10， 15， 20的数，再产生一个均匀分布的 0， 1， 2， 3， 4 的数。相加以后，会产生一个 0到24的数，而且每个数（除0外）生成的概率是一样的。我们只取
1 - 21 这一段，和7 取余以后+1就能得到完全均匀分布的1-7的随机数

时间： 2024-08-01 23:52:15

【算法】如何用随机函数rand5来构造随机函数rand7

常规方法

算法的一些释疑

晚些时候

【算法】如何用随机函数rand5来构造随机函数rand7的相关文章

FP-Growth算法python实现之 FP-tree的构造

如何用几何作图法构造阿基米德双子圆

斐波那契算法的对数解法计算机程序的构造和解释习题1.19

一道随机函数题：由rand5()生成rand7()

新型随机函数——乱排函数的制作

随机函数Surprising

基础算法思想（二）

【转载】聚类算法小结

机器学习（九）—FP-growth算法