Shape Analysis课程笔记10-Distance Metrics and Embeddings
这个系列是MIT 6.838: Shape Analysis的同步课程笔记。本课程会介绍几何方法在图形学、机器学习、计算机视觉、医疗图像以及建筑设计等相关领域的原理和应用。本节主要介绍度量空间的相关概念。
在上一章节中我们介绍了测地线和测地距离的相关概念,而在这一章节我们会考虑它的逆问题,即已知样本点之间的距离然后恢复它们本身的几何。这一问题也称为inverse distance problem。


实际上这样的问题不仅在几何处理中有大量的应用,在机器学习等相关领域中也同样有着重要的意义。

具体来说,我们的基本目标是在给定样本之间距离的基础上计算样本的嵌入(embedding)。

Metric Space
我们先来介绍一下度量空间(metric space)的概念。在集合
- 非负性(non-negativity):
- 同一性:
- 对称性(symmetry):
- 三角不等式(triangle inequality):

除了我们常见的欧式空间外,配备了测地距离的流形以及

Embedding a Metric Space
由于度量空间是非常丰富的,在实践中我们更关心如何把一个广义上的度量空间映射到一个方便进行处理的空间(如欧式空间)上。如果存在一个映射能够将沟通两个度量空间,而且保证映射前后样本之间的距离是不变的,则称这样的一个映射是等距(isometry)的。

显然我们希望可以把一个任意的度量空间通过等距映射变换到欧式空间上。不过遗憾的是这基本是不可能的,即使是有限度量空间也不能保证一定可以通过等距映射转换为欧式空间。

但对于有限度量空间可以证明存在等距映射将样本嵌入到某个由无穷范数定义的欧式空间

这里我们简单证明一下上面的结论。假设存在有限度量空间
不难证明
对于右边有:
同时根据三角不等式,对于任意
即
综合上面的推导可以得到:
即原始度量空间

Approximate Embedding
Approximate Isometry
尽管上面的推导说明我们可以把有限度量空间映射到欧式空间中,但映射后的度量空间
因此我们可以放松等距映射的要求,只要两个度量空间是近似等距(approximate isometry)即可。对于原始度量空间上的距离函数

Fréchet Embedding
具体地,Fréchet embedding就是这样的一种映射方法。我们只需要在原始空间中选择一系列子集

Bourgain’s Theorem
同时,Bourgain定理(Bourgain’s theorem)指出我们可以把有限度量空间近似等距地映射到一个相对低维的欧式空间中。

Embedding Metrics into Euclidean Space
Euclidean Problem
接下来考虑如何从度量来恢复几何的问题。假设在欧式空间

实际上这个问题并不简单。比如说我们可以对样本进行平移和旋转,此时样本之间的距离是保持不变的。这说明对于样本重建问题可能有多个可行解。
Gram Matrix
根据样本矩阵我们可以定义Gram矩阵(Gram matrix):
Gram矩阵的每一个元素表示对应样本的内积:

Classical MDS
利用Gram矩阵就可以把样本的重建问题分解为2步:首先利用
Recover Gram Matrix
假设样本的中心为原点,即
注意到
根据中心化条件
因此我们可以定义一个辅助矩阵
这样我们就从

Recover from Gram Matrix
在继续推导如何重建样本坐标前,我们先来看一下Gram矩阵的性质。首先Gram矩阵的元素都是非负的,
其中矩阵

实际上前面推导的算法称为classical multidimensional scaling(classical MDS),它在机器学习以及数据可视化中都有重要的应用。


Landmark MDS
classical MDS算法的一个变体是landmark MDS。注意到:
整理后得到:
从列的角度看,上式等价于:
其中

SMACOF and Variants
除了上面介绍的MDS相关算法外我们还可以从优化的角度来认识样本重建问题。此时我们希望嵌入后样本之间的距离矩阵可以尽可能地接近已知的距离矩阵,这样可以得到优化问题:
其中

首先对目标函数进行展开:
对第一项进行展开可以得到:
其中
接下来考虑第二项

这样整个优化问题的非凸性都位于矩阵
显然原始的优化目标等于
然后考虑
由于

这样我们就可以通过不断优化上界
可以证明这样的迭代方式是单调不增的:
这种迭代式算法的另一个好处在于当我们固定了
即迭代格式可以表示为:

因此SMACOF算法的本质是优化原始目标的一个凸的上界来逐步最小化目标函数。尽管这种方法理论上并不能保证收敛到全局最优值,但大量的实践表明它仍然可以收敛到一个足够好的解上。

SMACOF算法有很多的应用,比如说可以使用它来可视化图或者对网格进行变形等。



限于课时有限本节课只能对multidimensional scaling这类方法进行简单的介绍,更多的细节可以参考专业教材。
