A.3 奇异值分解

任意实矩阵 A∈Rm×n\mathbf{A} \in \mathbb{R}^{m \times n}ARm×n 都可分解为

A=UΣVT,(A.33) \mathbf{A} = \mathbf{U} \mathbf{\Sigma} \mathbf{V}^T, \tag{A.33} A=VT,(A.33)

其中, U∈Rm×m\mathbf{U} \in \mathbb{R}^{m \times m}URm×m 是满足 UTU=I\mathbf{U}^T \mathbf{U} = \mathbf{I}UTU=Immm 阶酉矩阵(unitary matrix); V∈Rn×n\mathbf{V} \in \mathbb{R}^{n \times n}VRn×n 是满足 VTV=I\mathbf{V}^T \mathbf{V} = \mathbf{I}VTV=Innn 阶酉矩阵; Σ∈Rm×n\mathbf{\Sigma} \in \mathbb{R}^{m \times n}ΣRm×nm×nm \times nm×n 的矩阵,其中 (Σ)ii=σi(\mathbf{\Sigma})_{ii} = \sigma_i(Σ)ii=σi 且其他位置的元素均为 0, σi\sigma_iσi 为非负实数且满足 σ1≥σ2≥…≥0\sigma_1 \geq \sigma_2 \geq \ldots \geq 0σ1σ20

式(A.33)中的分解称为奇异值分解(Singular Value Decomposition, 简称 SVD),其中 U\mathbf{U}U 的列向量 ui∈Rmu_i \in \mathbb{R}^muiRm 称为 A\mathbf{A}A 的左奇异向量(left-singular vector), V\mathbf{V}V 的列向量 vi∈Rnv_i \in \mathbb{R}^nviRn 称为 A\mathbf{A}A 的右奇异向量(right-singular vector), σi\sigma_iσi 称为奇异值(singular value)。矩阵 A\mathbf{A}A 的秩(rank)就等于非零奇异值的个数。

奇异值分解有广泛的用途,例如对于低秩矩阵近似(low-rank matrix approximation)问题,给定一个秩为 rrr 的矩阵 A\mathbf{A}A ,欲求其最优 kkk 秩近似矩阵 A~\tilde{\mathbf{A}}A~k<rk < rk<r ,该问题可形式化为

min⁡A~∈Rm×n∥A−A~∥Fs.t.rank(A~)=k.(A.34) \min_{\tilde{\mathbf{A}} \in \mathbb{R}^{m \times n}} \|\mathbf{A} - \tilde{\mathbf{A}}\|_F\\ s.t. \text{rank}(\tilde{\mathbf{A}}) = k . \tag{A.34} A~Rm×nminAA~Fs.t.rank(A~)=k.(A.34)
奇异值分解提供了上述问题的解析解:对矩阵 A\mathbf{A}A 进行奇异值分解后,将矩阵 Σ\mathbf{\Sigma}Σ 中的 r−kr-krk 个最小的奇异值置零获得矩阵 Σk\mathbf{\Sigma}_kΣk ,即仅保留最大的 kkk 个奇异值,则

Ak=UkΣkVkT(A.35) \mathbf{A}_k = \mathbf{U}_k \mathbf{\Sigma}_k \mathbf{V}_k^T \tag{A.35} Ak=UkΣkVkT(A.35)

就是式(A.34)的最优解,其中 Uk\mathbf{U}_kUkVk\mathbf{V}_kVk 分别是式(A.33)中的前 kkk 列组成的矩阵。这个结果称为 Eckart-Young-Mirsky 定理。


补充酉矩阵性质:

酉矩阵的性质

酉矩阵(Unitary Matrix)是复数域上满足以下条件的n×nn \times nn×n矩阵UUU
U∗U=IU^* U = IUU=I
其中U∗U^*U表示UUU的共轭转置,III为单位矩阵。以下是其主要性质:

  1. 逆矩阵与共轭转置的关系
    酉矩阵的逆矩阵等于其共轭转置:
    U−1=U∗U^{-1} = U^*U1=U

  2. 行列式的模长
    酉矩阵的行列式绝对值为1:
    ∣det⁡(U)∣=1|\det(U)| = 1det(U)=1

  3. 保持内积与向量长度
    对任意向量x,y∈Cnx, y \in \mathbb{C}^nx,yCn,酉矩阵保持内积和向量长度不变:
    ⟨Ux,Uy⟩=⟨x,y⟩,∥Ux∥=∥x∥\langle Ux, Uy \rangle = \langle x, y \rangle, \quad \|Ux\| = \|x\|Ux,Uy=x,y,Ux=x

  4. 特征值的性质
    酉矩阵的特征值λ\lambdaλ满足∣λ∣=1|\lambda| = 1λ=1,即分布在复平面的单位圆上。

  5. 矩阵乘积的酉性
    UUUVVV均为酉矩阵,则它们的乘积UVUVUV也是酉矩阵。

  6. 与正交矩阵的关系
    在实数域中,酉矩阵退化为正交矩阵,满足Q⊤Q=IQ^\top Q = IQQ=I

  7. 奇异值均为1
    酉矩阵的奇异值分解(SVD)中所有奇异值为1,即:
    U=UΣV∗  ⟹  Σ=IU = U \Sigma V^* \implies \Sigma = IU=UΣVΣ=I
    这一性质使其在信号处理和量子力学中尤为重要。


Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐