洗牌的正确姿势-Knuth shuffle算法

关于洗牌问题：

怎样用计算机模拟出足够随机的洗牌结果，看似很简单，但其实它比给一副乱糟糟的牌排好序可能还更难一些。洗牌问题的描述很简单：即如何通过打乱顺序，让一副扑克牌变成随机的排列，而且每一种可能的排列有相同机会出现。关键点在于“相同机会”，即各种随机排列是等可能的。下面先简单介绍一个常见的错误做法，然后看看如何改进变成Knuth 洗牌算法。

先看看一个很直接的做法（一副牌在这里用一个数组表示）：

对数组从头到尾扫描一遍，扫描过程中，每次都从整个数组随机选一个元素，跟当前扫描到的元素交换位置。

也就是，先拿起第一张牌，把它跟从整副牌里随机挑出的另一张牌（把它叫做随机牌）交换位置（随机牌也可能是第一张牌自己，这个时候就相当于不交换位置）；接着拿起第二张牌，也把它跟随机选出的另一张牌交换位置；一直重复直到把最后一张牌跟随机牌交换位置。

用python实现起来也只有几行：

def shuffleSort(a):
  N = len(a)
  for i in range(N):
    j = random.randint(0, N-1)
    a[j], a[i] = a[i], a[j]

这样随机交换之后，每种排列出现的可能性会是等概率的吗？看起来好像会，但事实上，经过这样交换，总有一部分排列出现的概率更高一些，这个洗牌过程并没有很公平。

为什么不够公平？要从直觉上能够理解清楚还不是那么容易。我们用一个简单的例子来看看，假设这副牌只有三张，分别是{A，B， C}.

按照前面说的方法，第一轮把第一张牌A跟随机一张牌进行交换，会产生三个等可能的结果：

no change: {A, B, C}
swap with B: {B, A, C}
swap with C: {C, B, A}

第二轮从上述三种排列出发，把第二张牌跟随机的一张牌交换，得到九种（有重复）等可能的排列。第三轮也类似。用树状图表示可以看得直观些。

可以看到，最后产生的27个结果里面，{A, B, C}, {C, A, B}, {C, B, A}都出现了4次，而{A, C, B}, {B, A, C}, {B, C, A}都出现了5次。也就是说有些排序出现的可能性是4/27，有些却是5/27. 而且，随着牌数目的增加，这个概率的不均衡会更加严重。

我们重新看看这个方法。A,B,C三张牌的全排列只有6种，但是在这个方法里，一共产生了27个结果（27个分支），它不是6的倍数，怎么都没法给6种排列平均分嘛。所以，要让结果够公平，一个必要条件就是产生的分支是6的整数倍，也就是N!的整数倍。

Knuth洗牌算法

所以牌该怎么洗呢？在上述方法的基础上，做一处修改，就能剪去一些分支，让分支数是N!的整数倍。这就是Knuth洗牌算法。

def shuffleSort(a):
  N = len(a)
  for i in range(N):
    j = random.randint(0, i)
    a[j], a[i] = a[i], a[j]

唯一修改的就是随机牌j选取的方法，在拿起第i张牌时，只从它前面的牌随机选出j，而不是从整副牌里面随机选取。

Really? 就只是这样吗？

是的。就这么简单。

还是用{A, B, C}这三张牌作为例子看看。

第一轮拿起牌A，现在随机牌只能是A，经过第一轮之后，其实没有发生变换，还是{A,B,C}; (这一步也可以省略)

第二轮拿起牌B，从{A，B}里面随机选一张牌跟B交换，会得到两种等可能的结果：

swap with A: {B, A, C}
no change: {A, B, C}

第三轮从上面两种可能的排列出发，拿起最后一张牌（这里都是C），再从所有牌里面随机选一张跟它交换。树状图如下：

最终得到的结果只有6个，正好是三张牌的所有6种排列结果，每种出现一次。所以，Knuth洗牌算法是公平的。

做个实验验证一下，把牌数增加到5张{A,B,C,D,E},分别用以上两种洗牌算法做50w次使用，看5张牌的所有120种排列出现的次数是否足够接近。

算法1实验结果

算法2（Knuth shuffle）实验结果

第一种算法的洗牌结果中，各种排序出现次数在2500~7500之间有很大波动，而在Knuth洗牌算法的结果中，每种排序出现的次数都在4000左右，符合计算结果（50w/120=4166.7）。

洗牌的正确姿势-Knuth shuffle算法

关于洗牌问题：

Knuth洗牌算法

发布者：jkyu

3 thoughts on “洗牌的正确姿势-Knuth shuffle算法”

留下评论取消回复

关于洗牌问题：

Knuth洗牌算法

共享此文章：

发布者：jkyu

3 thoughts on “洗牌的正确姿势-Knuth shuffle算法”

留下评论 取消回复

留下评论取消回复