这节课的主题包含以下几个方面:

  • 矩阵的4个子空间
  • 左逆矩阵
  • 右逆矩阵
  • 伪逆矩阵
  • 空间映射

1. 特殊矩阵逆

1.1 左逆矩阵 - 列满秩

假设我们有一个m行n列的矩阵A,秩为r,当 r = n时,求矩阵A的左逆矩阵。

  • r = n 时,可得 r ( A T A ) = n \mathrm{r}{(A^TA)}=n r(ATA)=n,所以可得 A T A A^TA ATA可逆,所以可得
    ( A T A ) − 1 A T A = I ⇒ A l e f t − 1 = ( A T A ) − 1 A T \begin{equation} (A^TA)^{-1}A^TA=I\quad \Rightarrow\quad A_{left}^{-1}=(A^TA)^{-1}A^T \end{equation} (ATA)1ATA=IAleft1=(ATA)1AT
    A l e f t − 1 A_{left}^{-1} Aleft1右乘A得到I,左乘以A,得到t
  • 最小二乘法
    A T A x ^ = A T b ⇒ x ^ = ( A T A ) − 1 A T b ⇒ p = A x ^ = A ( A T A ) − 1 A T b \begin{equation} A^TA\hat{x}=A^Tb\Rightarrow \hat{x}=(A^TA)^{-1}A^Tb\Rightarrow p=A\hat{x}=A(A^TA)^{-1}A^Tb \end{equation} ATAx^=ATbx^=(ATA)1ATbp=Ax^=A(ATA)1ATb
  • 投影矩阵P
    P = A ( A T A ) − 1 A T = A A l e f t − 1 \begin{equation} P=A(A^TA)^{-1}A^T=AA_{left}^{-1} \end{equation} P=A(ATA)1AT=AAleft1
    这个左逆矩阵 A A l e f t − 1 AA_{left}^{-1} AAleft1居然跟投影矩阵P一样!!!!

1.2 右逆矩阵 - 行满秩

假设我们有一个m行n列的矩阵A,秩为r,当 r = m时,求矩阵A的右逆矩阵。

  • r = m 时,可得 r ( A A T ) = m \mathrm{r}{(AA^T)}=m r(AAT)=m,所以可得 A A T AA^T AAT可逆,所以可得
    A A T ( A A T ) − 1 = I ⇒ A r i g h t − 1 = A T ( A A T ) − 1 \begin{equation} AA^T(AA^T)^{-1}=I\quad \Rightarrow\quad A_{right}^{-1}=A^T(AA^T)^{-1} \end{equation} AAT(AAT)1=IAright1=AT(AAT)1
  • 投影矩阵与左右逆矩阵的关系
    1. 将向量投影到A的列空间中
      A A l e f t − 1 = A ( A T A ) − 1 A T = P c o l u m n s \begin{equation} AA_{left}^{-1}=A(A^TA)^{-1}A^T=P_{columns} \end{equation} AAleft1=A(ATA)1AT=Pcolumns
    1. 将向量投影到A的行空间中
      A r i g h t − 1 A = A T ( A A T ) − 1 A = P r o w s \begin{equation} A_{right}^{-1}A=A^T(AA^T)^{-1}A=P_{rows} \end{equation} Aright1A=AT(AAT)1A=Prows

1.3 映射

假设 x 1 ≠ x 2 ∈ x_1\neq x_2\in x1=x2RowSpace, A x 1 = y 1 , A x 2 = y 2 Ax_1=y_1,Ax_2=y_2 Ax1=y1,Ax2=y2,假设 y 1 = y 2 ∈ y_1=y_2\in y1=y2ColumnSpace,
那么可以得到 A ( x 1 − x 2 ) = 0 A(x_1-x_2)=0 A(x1x2)=0,那么可以得到向量 x 1 − x 2 x_1-x_2 x1x2在A矩阵的零空间中,但是零空间中的向量是可行空间中的向量正交的,无法通过从行空间的任意两个向量通过线性组合而成一个零空间的向量。所以产生了矛盾,所以 y 1 ≠ y 2 y_1\neq y_2 y1=y2

2. 四个子空间

我们知道,对于一个m 行 n 列的矩阵A来说,根据列和行来说,分成4个空间,

  • C ( A ) C(A) C(A)列空间(columns space),维度为 R m R^m Rm
  • C ( A T ) C(A^T) C(AT)行空间(rows space),维度为 R n R^n Rn
  • N ( A ) N(A) N(A)零空间(rows space),维度为 R n R^n Rn
  • N ( A T ) N(A^T) N(AT)左零空间(rows space),维度为 R m R^m Rm
    四个子空间的相互关系如下:
    在这里插入图片描述

3. 伪逆矩阵

左逆矩阵和右逆矩阵都是在秩为m,或者n的情况下求出来的,不具备一般性,一般情况下,我们矩阵A的秩r , r ≤ m , r ≤ n r\leq m,r\leq n rm,rn,在这个情况下, A T A , A A T A^TA,AA^T ATA,AAT均无法得到可逆矩阵,也就无法生成一个逆矩阵了,这时我们就需要用到奇异值分解SVD.

  • 先将矩阵A进行SVD奇异值分解
    A = U Σ V T \begin{equation} A=U\Sigma V^T \end{equation} A=UΣVT
  • 求伪逆 A + A^{+} A+
    A + = V Σ − 1 U T \begin{equation} A^{+}=V\Sigma^{-1} U^T \end{equation} A+=VΣ1UT
  • 但发现,这个 Σ \Sigma Σ里面有0,直接求逆求不出来,失败了
  • 加一个惩罚项目 δ → 0 \delta \rightarrow 0 δ0
    ( A T A + δ 2 I ) x ^ = A T b ⇒ x ^ = ( A T A + δ 2 I ) − 1 A T b \begin{equation} (A^TA+\delta^2I)\hat{x}=A^Tb\Rightarrow \hat{x}=(A^TA+\delta^2I)^{-1}A^Tb \end{equation} (ATA+δ2I)x^=ATbx^=(ATA+δ2I)1ATb
    这不就是岭回归吗?真神奇!!!
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐