随机算法线性同余法的理解

崔军辉

一花一世界,一沙一佛国

线性同余如何模拟随机算法

程序员对随机数一般都不陌生，而且众所周知，计算机中通常实现的是伪随机数列。何为伪随机数列？

伪随机数（或称伪乱数），是使用一个确定性的算法计算出来的似乎是随机的数序，因此伪随机数实际上并不随机

既然是通过算法来模拟随机过程，那什么样的算法可以达到接近随机的效果，它又是怎么实现的呢？

比较简单的一种便是线性同余法。

用线性同余法产生随机数的特点是非常容易实现，生成速度快，但是弊端也很明显，32位的数周期最长只能到 $2^{32}$ ，达不到需要高质量随机数的应用如加密应用的要求

了解这些以后，首先我脑中冒出一个疑问，为什么线性同余法可以做到模拟随机过程呢？所谓随机就是任何数字都有可能出现，也即所有数据出现是等概率的，符合均匀分布。那线性同余法是如何做到均匀分布的线性同余法是如何做到均匀分布的？

第一步我们需要理解线性同余的周期，上述定义中有清晰的说明，对取模M的线性同余产生的序列周期最大为M。设想下假设递推公式为 $N_{j+1}=(A*N_{j}+B)(mod M)$ , 若周期为T，则 $N_{k+T}=N_{k}$ , 由于 $N_{k+1}=(A*N_{k}+B)(mod M)$ , 也就是说唯一的 $N_{k}$ 决定唯一的 $N_{k+1}$ , 那么T必小于等于M，因为取模M共有M个不同的整数结果，第M+1个数一定和前面某一个数相同，而由于一一对应的递推关系，后面的序列也会依次与前面的数相同，最后必有周期T<=M。

其次乘积系数与取模最好互质，这个其实也比较好理解，仍以 $N_{j+1}=(A*N_{j}+B)(mod M)$ 为例，若A与M不互质，那假设 $A=a*d$ ， $M=m*d$ ，其中 $d>1$ 。扩展递推公式为 $N_{j+1}=A*N_{j}+B+k*M$ ，由于B为常数，可以当做一个偏移量，使两边都减去B，变换递推公式为 $N_{j+1}-B=(a*(N_{j}-B)+a*B+k*m)*d$ ，这样可以很容易推知对所有的 $N_{j+1}-B$ 均含有d这个因子，以 $d=2$ 为例，序列中原有的M个可能数字在循环中只能取到偶数值加偏移量B，也就意味着周期T<=M/2，这便破坏了整个序列的均匀分布。举几个简单的例子帮助理解，假设现在A=3，M=5，令 $N_{0}=2$ ，序列为{2，1，3，4，2，1....}周期为5，若取A=6，M=10，令 $N_{0}=2$ ，序列为{2，2，2....}周期为1

对应的其他条件，同样是为了确保整个序列周期为M。详细推导过于复杂，有想要了解的，建议参考这篇论文：

回到最初的疑问，线性同余法是如何做到均匀分布的。从上面我们可以得知，通过特定条件的参数选择，我们可以构造一个序列周期为M，且M的周期中各数字只出现一次，因此在整个序列中，各数字出现的频率是相同的，也就符合了均匀分布。

线性同余方程如何求解

明白随机分布与线性同余的关系后，我们扩展一下知识，来了解下线性同余方程的解法。这不仅仅是一个纯数学问题，它实际上有很多应用的例子，比如：

在一个圆环上有两只青蛙A和B，从0点自东向西为正方向，两只青蛙的位置分别为x,y，A每次跳m,B每次跳n，环总长为L.两只青蛙同时出发，两只青蛙落在同一点视为相遇，问最少经过几次跳跃两只青蛙相遇。

根据条件，我们列出解题方程： $(x+m*k)≡(y+n*k)(mod L)$ 其中≡代表两边取模

展开为 $x+m*k=y+n*k+L*k^{'}$

平移后转换为 $x-y=(n-m)*k+L*k^{'}$ 即 $(x-y)≡((n-m)*k)(mod L)$

令 $n-m=a$ , $x-y=b$ 可得 $a*k≡b(mod L)$ ,这便形如标准的一元线性同余方程

定义:a,b是整数，形如 $a*x≡b(mod M)$ ，且x是未知整数的同余式称为一元线性同余方程，其中≡ 及(mod M)表示两边对M取模

求解一元线性同余方程，首先需要将其一步步做如下变换：

标准的一元线性同余方程 $a*x≡b(mod M)$ 等价于 $a*x+M*y=b$
假设d为a与M的最大公约数，记为 $gcd(a,M)=d$ ,易知若x，y有解d必为b的因子，因此等式变换为 $a_{0}*x+M_{0}*y=b_{0}$ 其中 $a=a_{0}*d$ , $M=M_{0}*d$ , $b=b_{0}*d$ ,且 $a_{0},M_{0}$ 互质，即 $gcd(a_{0},M_{0})=1$
令 $x=x_{0}*b_{0},y=y_{0}*b_{0}$ 方程变换为 $a_{0}*x_{0}+M_{0}*y_{0}=1$ 即 $a_{0}*x_{0}≡1(mod M_{0})$