Shape Analysis课程笔记08-Geodesic Distances Intro & Theory

这个系列是MIT 6.838: Shape Analysis的同步课程笔记。本课程会介绍几何方法在图形学、机器学习、计算机视觉、医疗图像以及建筑设计等相关领域的原理和应用。本节主要介绍测地距离的基本概念。

Motivation

在接下来的几节课中我们会介绍如何计算曲面上点之间的距离。这里我们需要区分一下intrinsicextrinsic的概念,intrinsic是指我们只能在曲面(流形)上进行移动,而extrinsic则允许离开曲面。以下图为例,两个猫爪之间的extrinsic距离非常小,而intrinsic距离则很大。

曲面上的intrinsic距离也称为测地距离(geodesic distance),它可以理解为限制在曲线上移动时两点之间的最短距离。

计算测地距离并不简单。实际上距离函数可能有大量的局部极小值(local minimum),这容易导致我们在计算时的效率比较低而且会不那么稳定。

测地距离的另一大特点是它有很多相似的定义。这里需要说明的是尽管这些定义在欧式空间下是等价的,但在更一般的情况下往往是有区别的。

计算测地距离的一种方法是把网格理解为一张图,然后使用图上的最短路径算法来求解。当网格非常稠密时顶点之间的最短路径是测地距离的一个很好的近似,但在大多数情况下测地距离都是严格小于最短路径长度的,而且这种近似方式会产生各种各样的问题。

实际上可以严格证明图上的最短路径不会收敛到测地距离上,而且要计算测地距离还需要一些额外的处理。

Defining Geodesic Distance

False Equivalences

测地距离有很多「等价」的定义,但需要注意的是它们之间是由严格区别的。最常见的定义是全局的最短路径,如下图中棕色路线所示;与之对应的是局部最短路径,由黄色路线表示;而另一个常见的定义则是局部最直的路径,由绿色路线表示。

Derivative Formulas

回忆曲线弧长的定义,我们首先利用全局最短曲线来定义测地线。

由于直接计算弧长比较麻烦,更常用的处理方法是使用曲线的能量\(E[\gamma]=\frac{1}{2} \int_a^b \Vert \gamma'(t) \Vert_2^2 \ dt\)来代替弧长作为我们的优化函数。实际上能量\(E[\gamma]\)是弧长的一个上界,这里简单证明一下。设有实值函数\(f, g: [a, b] \rightarrow \mathbb{R}\),我们定义函数的内积为:

\[\langle f, g \rangle = \int_a^b f(t) g(t) \ dt\]

根据Cauchy-Schwarz不等式(Cauchy-Schwarz inequality)有:

\[\vert \langle f, g \rangle \vert \leq \Vert f \Vert_2 \ \Vert g \Vert_2\] \[\Vert f \Vert_2^2 = \langle f, f \rangle\]

因此有:

\[\begin{aligned} 2(b-a) E &= (b-a) \int_a^b \Vert \gamma'(t) \Vert_2^2 \ dt \\ &= \bigg[ \int_a^b 1 \ dt \bigg] \bigg[ \int_a^b \Vert \gamma'(t) \Vert_2^2 \ dt \bigg] \\ &= \langle 1, 1\rangle \cdot \langle \Vert \gamma' \Vert_2, \Vert \gamma' \Vert_2 \rangle \\ &= \Vert 1 \Vert_2^2 \cdot \big\Vert \Vert \gamma' \Vert_2 \big\Vert_2^2 \\ &\geq \langle 1, \Vert \gamma' \Vert_2 \rangle^2 \\ &= \bigg[ \int_a^b \Vert \gamma' \Vert_2 \ dt \bigg]^2 \\ &= L^2[\gamma] \end{aligned}\]

当且仅当\(\Vert \gamma' \Vert_2\)为常数时不等式取等号。

接下来我们引入能量\(E[\gamma]\)的微分:

\[\begin{aligned} \frac{d}{dt} E[\gamma_t] &= \frac{d}{dt} \frac{1}{2} \int_a^b \Vert \gamma_t'(s) \Vert_2^2 \ ds \\ &= \frac{1}{2} \int_a^b \frac{d}{dt} \Vert \gamma_t'(s) \Vert_2^2 \ ds \\ &= \int_a^b \gamma_t'(s) \cdot \frac{d\gamma_t'}{dt} (s) \ ds \\ &= \int_a^b \gamma_t'(s) \cdot \bigg( \frac{d\gamma_t}{dt} \bigg)' (s) \ ds \\ \end{aligned}\]

利用分部积分有:

\[\begin{aligned} \frac{d}{dt} E[\gamma_t] &= \int_a^b \gamma_t'(s) \cdot \bigg( \frac{d\gamma_t}{dt} \bigg)' (s) \ ds \\ &= \bigg[ \gamma_t' \cdot \frac{d\gamma_t}{dt} \bigg]_a^b - \int_a^b \gamma_t''(s) \cdot \frac{d\gamma_t}{dt}(s) \ ds \\ &= - \int_a^b \gamma_t''(s) \cdot \frac{d\gamma_t}{dt}(s) \ ds \end{aligned}\]

注意到曲线\(\gamma_t\)必须依附于曲面(流形)\(\mathcal{M}\),因此\(\frac{d\gamma_t}{dt}(s)\)一定位于切平面上,即\(\frac{d\gamma_t}{dt}(s) \in T_{\gamma_t(s)}\mathcal{M}\);同时\(\gamma_t''(s)\)则与曲线的法向共线。因此上式等价于先对\(\gamma_t''(s)\)利用切平面进行分解,然后把它在切平面上的投影与\(\frac{d\gamma_t}{dt}(s)\)进行内积。

\[\begin{aligned} \frac{d}{dt} E[\gamma_t] &= - \int_a^b \gamma_t''(s) \cdot \frac{d\gamma_t}{dt}(s) \ ds \\ &= -\int_a^b \bigg( \frac{d\gamma_t}{dt}(s) \cdot \text{proj}_{T_{\gamma_t(s)}\mathcal{M}} [\gamma_t''(s)] \bigg) \ ds \end{aligned}\]

因此,我们可以把曲线\(\gamma_t\)看做能量\(E[\gamma_t]\)的一个local minimizer。显然当\(\gamma_t\)为测地线时需要满足\(\forall \mathbf{v}: [a, b] \rightarrow \mathbb{R}^n\):

\[\int_a^b \bigg( \mathbf{v} \cdot \text{proj}_{T_{\gamma_t(s)}\mathcal{M}} [\gamma_t''(s)] \bigg) \ ds = 0\]

即测地线\(\gamma\)需要满足ODE:

\[\text{proj}_{T_{\gamma(s)}\mathcal{M}} [\gamma''(s)] \equiv 0\]

进一步可以证明此时的测地线\(\gamma\)的导数为常数:

\[\frac{d}{ds} \Vert \gamma'(s) \Vert^2 = 2 \gamma'(s) \cdot \gamma''(s) \equiv 0\]

结合能量\(E[\gamma]\)和弧长的关系可以得知\(\gamma\)具有(局部)最短弧长。

类似地可以证明测地线只有出切平面方向的加速度。

Exponential Map

上面的推导说明我们可以把测地线的计算问题转换为求解ODE。根据初始条件不同会有两种解法:给定端点位置或者给定起点位置以及方向。

利用起点位置和方向我们可以定义曲面(流形)上的指数映射(exponential map),它表示从起点\(\mathbf{p}\)出发以\(\mathbf{v}\)作为方向的测地线。

\[\exp_\mathbf{p}(t \mathbf{v}) = \gamma_\mathbf{p}(t)\]

这里我们再重申一下,通过求解ODE得到的测地线是局部的,它们可能不是曲面上两点之间的最短路径。

与之对应的概念是cut locus,它表示从\(\mathbf{p}\)点出发沿测地线进行移动时不再满足全局最短的点集。

Eikonal Equation

本节课最后介绍了eikonal方程(eikonal equation),它指出测地距离函数需要满足的条件:

\[\Vert \nabla u(\mathbf{p}) \Vert_2 = 1\]

这里需要注意的是梯度\(\nabla u\)是定义在切平面上的,即\(\nabla u(\mathbf{p}) \in T_\mathbf{p} \mathcal{M}\)。

Reference