OMSCS-SIM课程笔记10-Comparing Systems
这个系列是Gatech OMSCS 仿真和建模课程(ISYE 6644: Simulation and Modeling for Engineering and Science)的同步课程笔记。课程内容涉及计算机模拟在统计分析和建模中的应用,本节介绍利用随机模拟的结果对系统进行对比和评价的方法。
Introduction and Review of Classical Confidence Intervals
置信区间(confidence intervals, CI)是系统评价最常用的方法,因此我们首先来回顾一下CI的概念和性质。

Confidence Intervals for the Mean
假设有一系列独立同分布的正态分布随机变量
可以证明统计量


利用统计量

Confidence Intervals Difference Two Means
接下来考虑样本来自两个正态分布的情况。假设

如果

如果



Paired CI Difference Two Means
现实中另一种常见的情况是


在这种情况下可以构造出差异





Comparison of Simulated Systems
在随机模拟中数据之间往往不满足独立同分布假设,在这种情况下我们需要一些额外的处理来推导出置信区间。


Confidence Intervals for Mean Differences
利用独立重复试验,我们可以估计两个系统自身的均值和方差:

得到均值和方差后就可以计算两个系统差异的置信区间:

另一种可行的策略是把两个系统的试验看成是一对,然后利用Paired CI Difference的方法来估计置信区间:

Variance Reduction Techniques
Common Random Numbers
在比较不同系统时我们可以通过对仿真过程的控制来减少随机模拟的方差。比如说我们可以将不同系统的随机输入设置为相同的值,这样就可以比较它们在同样条件下的性能。

进一步可以证明这种使用相同随机输入的方法可以减少估计的方差并且能够给出更紧的置信区间。



Antithetic Random Numbers
减少方差的另一种方法是使用对立变量(antithetic random numbers),它的思想是主动引入负相关的随机变量来减少估计的方差。

以Monte Carlo积分为例,假设待估计的积分为


接下来我们构造这些随机样本的对立变量

Control Variates
除此之外还可以使用控制变量(control variates)来减少方差。假设我们已知一个与

可以证明这个新的估计


Ranking and Selection Methods
很多任务中我们需要从多个系统中挑选出其中最好的那个,此时就需要对这些系统进行排序。




Find the Normal Distribution with the Largest Mean
Introduction
在排序问题中最常见的情况是从k个未知参数的正态分布中选出均值最大的那个分布。

此时我们可以使用无差异区域(indifference zone)的方法进行选择。



Single-Stage Procedures
indifference zone方法中最基本的是single-stage procedure。single-stage procedure非常简单:我们假设k个系统都具有相同的方差,此时只需要根据样本均值进行排序并且选出均值最大的那个系统即可。


single-stage procedure的难点在于计算统计样本均值时所需的样本数。


所需样本数




Two-Stage Procedures




Multi-Stage Procedure





Find the Bernoulli with the Largest Success Probability
对于Bernoulli系统,我们希望能够挑选出概率最大的那个。这里同样使用了indifference zone方法进行排序。











Find the Most Probable Multinomial Cell
对于multinomial分布的系统,我们希望了解系统的哪个输出具有最高的概率。这样的问题同样可以使用indifference zone方法。


根据多项分布的性质,我们可以计算产生样本的概率以及基于样本进行选择时结果正确的概率。





在进行选择时同样需要考虑所需的样本数




