OMSCS-GA课程笔记07-Linear Programming
这个系列是Gatech OMSCS 高级算法课程(CS 6515: Intro to Grad Algorithms)的同步课程笔记。课程内容涉及动态规划、随机算法、分治、图算法、最大流、线性规划以及NP完备等高级算法的设计思想和相关应用,本节主要介绍线性规划。
Linear Programming
线性规划(linear programming, LP)是求解优化问题的一种重要技术,很多问题都可以通过转换为优化问题的方式来使用LP进行求解。

Examples
Max-Flow via LP
前面介绍过的最大流问题可以等价地表示为一个优化问题:我们为每条边上的流量设置一个变量\(f_e\),这样优化目标即为所有变量之和\(\sum_{e \in E} f_e\),而对应的约束包括\(f_e\)非负且小于等于容量\(c_e\)以及除源点和终点外所有节点的流入量等于流出量等。

Simple Production
LP的另一个常见例子是确定产品的最优配置。假设有两种产品A和B,A产品的利润是1而B产品的利润是6。客户对两种产品的最大需求分别为300和200,而生产两种产品分别需要1小时和3小时,总共可用的生产时间为700小时。我们的目标是确定两种产品的产量来最大化利润。

2D LP
上述问题可以形式化为如下的最优化问题。


实际上对于二维的LP问题还有非常直观的几何解释,其中所有变量能够取值的范围称为可行域(feasible region)。

由于目标函数是一个线性函数,待求优化问题等价于在可行域上选取一点使得目标函数对应直线方程有最大的截距。

从上面的例子不难发现LP问题有如下特点:
- 最优解可能不是整数
- LP可以在多项式时间内求解
- 可行域一定是凸集
- 最优解一定在可行域的顶点上

3D Example
对于三维的情况同样可以形式化LP问题。


三维LP问题也有直观的几何解释,它相当于在三维凸几何体上寻找目标函数的最优点。

Standard Form
对于更一般的情况,LP问题可以形式化为最优化包含n个变量的线性函数同时满足相应的线性约束。

如果从线性代数的角度来认识,还可以得到更加紧凑的表达形式。

显然这两种表达方式是相互等价的。

对于n维的情况我们很难直观地表示n维空间,不过此时的几何意义与低维情况是一样的。

由于LP问题的最优点一定是在凸集的边界点上,因此求解LP可以转换为计算凸集的边界点然后寻找目标函数的最大值。

求解LP问题的常用算法如下:

Simplex Algorithm
simplex算法会从零点开始不断寻找局部上能够增大目标函数的边界点。由于目标函数是凸的,当所有边界点上的函数值都小于当前点时说明已经找到了最优解。


Geometry
从几何角度来看,LP问题中每个约束都相当于在n维空间中定义了一个半空间(half space),而这些半空间的交集构成了问题的可行域。

由于目标函数是凸函数,LP问题仅在可行域为空以及可行域或是目标函数无界这两种情况下没有解。


因此在求解LP问题之前首先要判断是否存在上述两种无解的情况。对于可行域是否为空的问题,我们只需要考虑LP的约束即可。此时需要引入一个新的变量z来构造不等式约束:
\[A \mathbf{x} + z \leq b\] \[\mathbf{x} \geq 0\]接着,我们通过最大化z来判断可行域是否为空。如果z是非负的则说明存在可行域,而如果z为负数则可行域为空。

对于如何检查是否无界的情况我们留到对偶性中进行讲解。
Duality
LP问题的一大特点在于它的对偶性(duality)。当已知一个LP问题可以使用相应的算法进行求解来得到最优函数值,而如果已知函数值的可能取值能否验证是否存在相应的解呢?

Upper Bound
假设这个给定的函数值存在于可行域中,我们可以为线性约束赋予相应的系数来组合出目标函数。此时组合后不等式约束的右侧即为目标函数的上界。

Dual LP
那么如何计算组合系数呢?我们可以假设每一个不等式约束的系数为\(y_i\),然后它们加起来得到待定系数的不等式。对于不等式左边每一个未知数,我们要求它的系数至少为目标函数对应的系数。同时最小化不等式右端,这样就得到了一个新的最优化问题。不难发现这个新的优化问题与原问题有对偶的系数和形式,因此称为对偶问题。


General Form
更一般情况下的对偶形式可以表示如下:

更进一步,对偶问题也可以转换为一个等价的LP问题,而它的对偶等价于原始LP问题:

Weak Duality
LP的弱对偶(weak duality)定理指出对偶问题的目标函数是原始问题的一个上界。

更进一步,假设x和y分别是原始问题和对偶问题可行域中的点,如果两个优化问题的目标函数在该处有相同的值则说明x和y分别是两个问题的最优解。

Unbounded LP
弱对偶定理的另一个推论是如果原始LP是无界的则其对偶问题可行域为空;反之如果对偶问题是无界的则原始问题可行域为空。

利用这个推论就可以验证原始LP是否有界,我们只需要考虑其对偶问题的可行域即可。这样判断LP是否有解就只需要判断原始问题和其对偶问题可行域是否为空。

Strong Duality
LP的强对偶(strong duality)定理指出原始问题和对偶问题有(最优)解是相互等价的。

Max-SAT Approximation
max-SAT问题是SAT问题的一个变体,在max-SAT问题中即使不能满足所有的从句也要输出能够满足的最大从句数。实际上max-SAT是NP-hard问题,它要比SAT更加困难。

要精确求解max-SAT是非常困难的,不过借助LP我们可以近似求解这个问题。


Simple Scheme
最简单的近似求解方法是随机为每个变量赋值,此时可以证明能够满足的从句数量的期望至少为从句总数的1/2。




Ek-SAT
利用上面的结论可以证明对于3-SAT问题随机赋值能够满足7/8左右的从句。实际上这已经是3-SAT问题我们所能做到最好的算法了,寻找任何性能更好的算法都是NP-hard。

Integer-Programming
整数规划(integer-programming, ILP)是LP的一种常见变体,和LP相比ILP要求变量取值必须为整数。需要注意的是尽管LP由多项式时间解法,ILP是NP-hard。

实际上很多常见的NP完备问题都可以归约到求解ILP上,而max-SAT也可以归约到ILP上。




LP Relaxation
尽管精确求解ILP是不现实的,我们可以放松取值为整数的条件把它转换为一个LP来进行近似求解。显然放松后的LP问题的解是原始ILP问题的一个上界。

再进一步如果我们想要获得每个变量的整数取值只需要对每个变量进行取整即可,可以证明这样得到的近似解不会与ILP真正的解相差太多。

AM-GM





Comparison
总结一下,对于NP-hard问题在很多情况下我们都可以先把它归约到ILP上,然后放松为LP来获得近似解。

回到max-SAT问题上,当从句中的变量数k比较小时LP方法有更好的性能,而当k比较大时随机赋值方法反而效果更好。同时可以注意到不管采用那种算法,能够满足的从句比例都至少为3/4。

在实际求解max-SAT问题时一般会同时运行这两种算法,然后选择其中效果更好的那个。
