法卡斯定理(Fakars' Lemma)
定义证明
定义
最近在研究WGAN,其中的Wasserstein distance的求解需要用到法卡斯定理,于是特意去了解了一下,也算是对线性代数知识的一个补充。
法卡斯定理如下:
∃ x ∈ R n , A x = b a n d x ≥ 0 or ∃ y ∈ R d , A T y ≤ 0 a n d b T y > 0 \exists x \in R^n,Ax=b \ and \ x\ge0 \ \textbf{or} \ \exists y \in R^d, A^Ty \le 0 \ and \ b^Ty \gt 0 ∃x∈Rn,Ax=b and x≥0 or ∃y∈Rd,ATy≤0 and bTy>0
其中, A ∈ R d × n A \in R^{d\times n} A∈Rd×n, x ∈ R n x\in R^n x∈Rn, b ∈ R d b\in R^d b∈Rd.
接下来我们将证明整个定理。
背景知识
在证明这个定理之前,我们先来了解几个概念。
-
凸集(Convex set)
在n维空间中,x与y的线段(line segment)定义如下:
x , y ∈ R n , [ x , y ] : = λ x + ( 1 − λ ) y ∣ λ ∈ [ 0 , 1 ] x,y\in R^n, [x,y]:={\lambda x+(1-\lambda)y| \lambda \in [0,1]} x,y∈Rn,[x,y]:=λx+(1−λ)y∣λ∈[0,1]凸集定义如下:
∀ x , y ∈ C , [ x , y ] ⊆ C , C ⊆ R n \forall x,y \in C, [x,y] \subseteq C, C \subseteq R^n ∀x,y∈C,[x,y]⊆C,C⊆Rn满足上述条件,则C为凸集。
图示如下:
上图中左图为凸集,右图不是凸集。 -
分离定理(Separation theorem)
A ⊆ R n , B ⊆ R n A\subseteq R^n,B\subseteq R^n A⊆Rn,B⊆Rn是不相交的非空凸集,存在一个非零向量v和实数c,使得 ⟨ x , v ⟩ ≥ c a n d ⟨ y , v ⟩ ≤ c \langle x,v \rangle \ge c \quad and \quad \langle y,v\rangle \le c ⟨x,v⟩≥cand⟨y,v⟩≤c
其中, x ∈ A , y ∈ B x\in A,y\in B x∈A,y∈B,超平面为 ⟨ ⋅ , v ⟩ = c \langle \cdot ,v\rangle =c ⟨⋅,v⟩=c,v是法向量。 -
凸锥(Convex Cone)
了解凸锥之前我们先来了解一下锥
对于向量空间V,C是V的子集,如果满足
∀ x ∈ C a n d α > 0 , α x ∈ C \forall x\in C\ and \ \alpha >0, \alpha x\in C ∀x∈C and α>0,αx∈C
那么C是锥。
对于锥C,如果满足
∀ x , y ∈ C a n d α , β ≥ 0 , α x + β y ∈ C \forall x,y\in C\ and\ \alpha,\beta \ge 0, \alpha x+\beta y \in C ∀x,y∈C and α,β≥0,αx+βy∈C
那么C是凸锥。
证明
给定矩阵 A ⊆ R d × n A\subseteq R^{d\times n} A⊆Rd×n,我们将其看作n个向量 a 1 , . . . , a n ∈ R d a_1,...,a_n\in R^d a1,...,an∈Rd,给定 x ∈ R n ( x > 0 ) x\in R^n(x>0) x∈Rn(x>0), 于是我们得到了一个凸锥 A x , ∀ x > 0 Ax,\forall x\gt 0 Ax,∀x>0
对于一个向量 b ∈ R d b\in R^d b∈Rd,有两种可能,b在上述的凸锥中;b不在上述凸锥中。如果b不再凸锥中,那么我们可以找到一个经过原点的超平面h,h位于b和凸锥之间,h的法向量为 y ∈ R d y\in R^d y∈Rd。b和y处于h的同侧,而凸锥则在h的另一侧,那么我们有 b T y > 0 b^Ty\gt0 bTy>0,同时, a i T y < 0 a_i^Ty\lt 0 aiTy<0.
总结以上两种情况,
- ∃ x ∈ R n , A x = b a n d x ≥ 0 \exists x \in R^n,Ax=b \ and \ x\ge0 ∃x∈Rn,Ax=b and x≥0
- ∃ y ∈ R d , A T y ≤ 0 a n d b T y > 0 \exists y \in R^d, A^Ty \le 0 \ and \ b^Ty \gt 0 ∃y∈Rd,ATy≤0 and bTy>0
参考资料
更多推荐

所有评论(0)