【算法】—— 随机音乐的播放算法

随机播放音乐，这个功能太普通以至于以前从未考虑过其背后实现逻辑。

Random还是shuffle

我们经常使用的随机播放功能，在外国同行口中并不是叫Random播放，而是叫Shuffle，洗牌的意思。

为什么不是Random？来看两个例子。

在Spotify成立之初，他们使用一种叫「Fisher-Yates shuffle」的算法去产生一个完全随机（perfectly random ）的播放列表，这个算法据说非常简单，只需3行代码搞定，不过它存在致命弱点。

上图中，每种颜色代表一位歌手，也就是说我的列表里有绿色歌手的4首歌，红色歌手的2首歌，黑色歌手的2首歌。

图中上下两行都是运行Fisher-Yates算法可能产生的播放列表，请问这两个列表出现的概率哪个更大呢？

答案是一样大，完全随机算法下，每一首歌出现在每个位置的概率是一样的。你可能认为这怎么可能，前面已经出现3次绿色歌手的歌了，下一次出现概率应该很小了吧。错了，算法是没有记忆的，除非你告诉它，下一首不允许播放绿色歌手的歌，否则它播放绿色歌手的歌的概率还是50%。

再来看个例子，假设你播放列表里有10首摇滚乐（A），11首乡村乐（B），11首爵士乐（C），下面是我自己用Python的random函数生成的序列：

A A A A C C C B C B B A C B C B B B B A B C B A C A C C A A C B

可以看出，这个列表里前半段和后半段基本上没有B出现，尤其是前面连续4个A和3个B，这样的结果是无法令人满意的，一点均衡性都没有。

回头再想，我们为什么要随机播放？因为我们不知道要听什么，我们想要一个随性的播放列表，我们不想专门听某一位歌手的或某一张专辑的曲目，我们不想按照平常循环的顺序播放，我们想换换口味有点新意，所以我们把这个选择权交给软件本身去做，如果软件接连给你播放同一个歌手或同一张专辑的曲目，那就违背我们随机的目的了。所以好的随机播放列表应该做到均衡分布，同一个流派、同一个歌手、同一种专辑下的音乐彼此之间相距越远越好。

还是上面这个例子，好的播放列表应该是下面这样的：

A B C B C A B A C B A C B C A B C A C B A B C A C B A C B C A B