OMSCS-SIM课程笔记03-Hand and Spreadsheet Simulations

这个系列是Gatech OMSCS 仿真和建模课程(ISYE 6644: Simulation and Modeling for Engineering and Science)的同步课程笔记。课程内容涉及计算机模拟在统计分析和建模中的应用，本节介绍随机模拟的基本方法。

Stepping Through a Differential Equation

在正式介绍随机模拟前我们首先来看一下如何通过模拟的方法来求解微分方程。假设我们已知函数\(f(x)\)的导数\(f'(x)\)，利用导数的定义我们可以使用差分进行近似：

\[f'(x) \approx \frac{f(x+h) - f(x)}{h}\]

整理后可以得到迭代形式：

\[f(x+h) \approx f(x) + h f'(x)\]

这种求解微分方程的方法称为Euler方法(Euler’s method)。对于给定的边界条件，我们可以利用Euler方法进行迭代来获得\(f(x)\)的表格。当步长\(h\)比较小而且在边界附近时Euler方法有比较好的近似结果。

Monte Carlo Integration

接下来我们考虑积分的情况。对于任意可积函数\(g(x)\)，假设我们需要计算它在[a, b]区间上的积分：

\[I = \int_a^b g(x) \ dx\]

通过换元可以把它转换成[0, 1]标准区间上的积分：

\[I = \int_a^b g(x) \ dx = (b-a) \int_0^1 g(a + (b-a) u) \ du\]

其中，\(u = \frac{x-a}{b-a}\)。当然我们可以利用梯形公式(trapezoidal rule)或是Gauss–Laguerre积分(Gauss–Laguerre quadrature)来进行计算，不过当\(g(x)\)比较复杂时使用数值积分可能是比较困难的。在这种情况下我们可以使用随机模拟来进行计算，这种通过生成随机数来计算积分的方法称为蒙特卡洛积分(Monte Carlo integration, MC)。

使用MC时我们首先从(0, 1)区间上的均匀分布进行采样，然后定义\(I_i\)为使用样本\(U_i\)计算得到的函数值：

\[I_i = (b-a) \cdot g(a + (b-a) U_i)\]

其中\(U_i \sim \text{Unif}(0, 1)\)。显然\(I_i\)是一个随机变量，而它的均值满足：

\[\bar{I}_n = \frac{1}{n} \sum_{i=1}^n I_i = \frac{b-a}{n} \sum_{i=1}^n g(a + (b-a) U_i)\]

进一步对\(\bar{I}_n\)求期望得到：

\[\begin{aligned} E[\bar{I}_n] &= (b-a) \cdot E[g(a + (b-a) U_i)] \\ &= (b-a) \cdot \int_0^1 g(a + (b-a)u) f(u) \ d u \\ &= (b-a) \cdot \int_0^1 g(a + (b-a)u) \ d u \\ &= I \end{aligned}\]

也就是说\(\bar{I}_n\)是积分\(I\)的一个无偏估计，类似地可以证明它的方差满足\(V(\bar{I}_n) = O(\frac{1}{n})\)。依据大数定理我们可以认为当\(n \to \infty\)时，\(\bar{I}_n\)会收敛到\(I\)(\(\bar{I}_n \to I\))。

更进一步我们还可以估计\(\bar{I}_n\)的置信区间。根据CLT有

\[\bar{I}_n \approx \text{Nor}(E[\bar{I}_n], V[\bar{I}_n]) \sim \text{Nor}(I, V(I_i / n))\]

那么\(I\)在\(100(1-\alpha)\%\)水平下的置信区间为：

\[I \in \bar{I}_n \pm \sqrt{\frac{S_I^2}{n}} \cdot z_{\alpha/2}\]

其中\(z_{\alpha/2}\)为标准正态分布\(\alpha/2\)处对应的分位数，\(S_I^2\)为样本方差\(S_I^2 = \frac{1}{n-1} \sum_{i=1}^n (I_i - \bar{I}_n)^2\)。

Making Some \(\pi\)

MC的一个经典应用是估计圆周率\(\pi\)的值。假设\(U_1\)和\(U_2\)服从均匀分布\(\text{Unif}(0, 1)\)且相互独立，则点\((U_1, U_2)\)位于圆内的条件为：

\[\bigg(U_1 - \frac{1}{2} \bigg)^2 + \bigg(U_2 - \frac{1}{2} \bigg)^2 \leq \frac{1}{4}\]

因此我们可以建立一个指示函数\(I(u_1, u_2)\)表示样本点是否落在圆内：

\[I(u_1, u_2) = \left\{ \begin{aligned} & 1, & & \text{if} \ \bigg(u_1 - \frac{1}{2} \bigg)^2 + \bigg(u_2 - \frac{1}{2} \bigg)^2 \leq \frac{1}{4} \\ & 0, & & \text{otherwise} \end{aligned} \right.\]

显然\(I(u_1, u_2)\)的积分为\(\frac{\pi}{4}\)。通过MC我们只需要生成大量的样本然后计算指示函数并取均值即可完成对\(\frac{\pi}{4}\)的估计。