最优传输(OT)
1. 基本概念最优传输是在可分度量空间中,讨论概率测度间最优传输变换的一类优化问题,涉及到偏微分方程和凸几何等多种理论,是多学科交叉的研究领域。直观的一个解释是:假设有两个工地\( X \)和\( Y \),工地\( X \)上有\( m \)堆土,工地\( Y \)上有\( n 
1. 基本概念
最优传输是在可分度量空间中,讨论概率测度间最优传输变换的一类优化问题,涉及到偏微分方程和凸几何等多种理论,是多学科交叉的研究领域。直观的一个解释是:假设有两个工地XXX和YYY,工地XXX上有mmm堆土,工地YYY上有nnn个坑,现在要将工地XXX上的mmm堆土全部移动到工地YYY上的nnn个坑中,如何移动才能使做工最少?在最优传输方案下做的功就是最少的功,这在工程上被称为推土机距离。最优传输问题非常复杂,最近在图像处理领域发展迅速,吸引了越来越多学者的重视和关注
1781年法国数学家Monge首先提出了最优传输问题,力求在给定代价函数下寻求将一种分布变换成另外一种分布的有效方式,如图所示。其数学表述如下:
设XXX、YYY为完备可分的度量空间,其概率测度分别为μ∈P(X)\mu\in P(X)μ∈P(X),ν∈P(Y)\nu\in P(Y)ν∈P(Y),现在有一个映射T:X→YT:X\to YT:X→Y,假设两空间的总测度相同,即:
∫Xμ=∫Yν \int_{X}\mu=\int_{Y}\nu ∫Xμ=∫Yν
满足上式,映射就是保测度的,记为T#μ=νT_{\#}\mu=\nuT#μ=ν,设代价函数c:X×Y→[0,+∞]c:X\times Y\to [0,+\infty]c:X×Y→[0,+∞],最优传输映射就是在所有保测度映射中,传输代价最小者,即求解:
infM(T):=∫Xc(x,T(x))dμ(x):T#μ=ν \inf {M(T):=\int_{X}c(x,T(x))d\mu(x):T_{\#}\mu=\nu} infM(T):=∫Xc(x,T(x))dμ(x):T#μ=ν
在保质量条件T#μ=νT_{\#}\mu=\nuT#μ=ν的前提下,将分布μ\muμ变换为分布ν\nuν,且代价最小的方案就是最优传输方案TTT,但是由于保质量条件的存在,变成了一个难以求解的非凸问题,且最优传输方案不一定存在
Monge形式的最优传输问题求解困难且具有一定的病态性,但是由于18世纪各种数学定理发展不够成熟,最优传输问题一直没有得到很好的解决。直到1942年Kantorovich成功地解决了此问题,如图所示,Kantorovich形式的最优传输可以描述为:不将每一堆土直接填充到坑中,而是将一堆土分为若干部分然后进行填充。其数学表述如下:
设XXX、YYY为完备可分的度量空间,其概率测度分别为μ∈P(X)\mu\in P(X)μ∈P(X),ν∈P(Y)\nu\in P(Y)ν∈P(Y),代价函数c:X×Y→[0,+∞]c:X\times Y\to[0,+\infty]c:X×Y→[0,+∞],求解:
infK(γ):=∫X×Yc(x,y)dγ(x,y):γ∈∏(μ,ν) \inf {K(\gamma):=\int_{X\times Y} c(x,y) d\gamma(x,y) :\gamma\in \prod(\mu,\nu)} infK(γ):=∫X×Yc(x,y)dγ(x,y):γ∈∏(μ,ν)
其中∏(μ,ν)\prod(\mu,\nu)∏(μ,ν)为传输计划的集合,即∏(μ,ν)={γ∈P(X×Y):(πx)#γ=μ,(πy)#γ=ν}\prod(\mu,\nu)=\{\gamma\in P(X\times Y):(\pi_{x})_{\#}\gamma=\mu,(\pi_{y})_{\#}\gamma=\nu\}∏(μ,ν)={γ∈P(X×Y):(πx)#γ=μ,(πy)#γ=ν}, 也可以看作是μ\muμ,ν\nuν的联合概率密度,上式的保质量条件为(πx)#γ=μ,(πy)#γ=ν(\pi_{x})_{\#}\gamma=\mu,(\pi_{y})_{\#}\gamma=\nu(πx)#γ=μ,(πy)#γ=ν,也可以表示为γ(A×Y)=μ(A),γ(X×B)=ν(B)\gamma(A\times Y)=\mu(A),\gamma(X\times B)=\nu(B)γ(A×Y)=μ(A),γ(X×B)=ν(B),当γ\gammaγ最小时的传输方案就是所求的最优传输计划。Kantorovich形式与Monge形式不同,Kantorovich的方案可以处理任意的可测集,并且可以将质量进行分解,从一个位置传输到任意多个位置。1991年Brenier证明,当代价函数c(μ,ν)=12∥μ−ν∥2c(\mu,\nu)=\frac{1}{2}\left\|\mu-\nu\right\|^{2}c(μ,ν)=21∥μ−ν∥2时最优传输方案存在且唯一,形式为T(x)=∇u(x)T(x)=\nabla u(x)T(x)=∇u(x),其中uuu为凸函数
最优传输问题的最小距离被称为Wasserstein距离,也被称为Monge-Kantorovich距离或者推土机距离,数学定义如下:
设Ω⊂Rd\Omega\subset\mathbb{R}^{d}Ω⊂Rd,μ,ν∈Pp(Ω)\mu,\nu\in P_{p}(\Omega)μ,ν∈Pp(Ω),Wasserstein距离定义为:
Wp(μ,ν):=min{∫Ω×Ω∥x−y∥pdγ:γ∈∏(μ,ν)}1p W_{p}(\mu,\nu):=\min\{\int_{\Omega\times \Omega}\left\| x-y\right\|^{p}d\gamma:\gamma\in\prod(\mu,\nu)\}^{\frac{1}{p}} Wp(μ,ν):=min{∫Ω×Ω∥x−y∥pdγ:γ∈∏(μ,ν)}p1
其中Pp(Ω)={μ∈P(Ω):∫Ω∥x∥pdμ<+∞}P_{p}(\Omega)=\{\mu\in P(\Omega):\int_{\Omega}\left\|x\right\|^{p}d\mu<+\infty\}Pp(Ω)={μ∈P(Ω):∫Ω∥x∥pdμ<+∞},p∈[1,+∞)p\in[1,+\infty)p∈[1,+∞)。由上式可知,Wasserstein距离的p次方是最优传输问题在代价函数为c(x,y)=∥x−y∥pc(x,y)=\left\|x-y\right\|^pc(x,y)=∥x−y∥p时的最小传输代价,在图像处理领域,Wasserstein距离表现通常优于其他距离。
更多推荐


所有评论(0)