内容概述

本章首先由倒数的概念,引申出逆矩阵的概念。接着讲解了利用行列式来计算二阶方阵逆矩阵的方法。接下来,讲解了可逆矩阵对应线性方程解的唯一性,以及可逆矩阵的几个有用的性质。本章的最后,讲解了计算逆矩阵的一种通用方法,即利用初等矩阵来计算逆矩阵。

由倒数引申出矩阵的逆

假设有一个实数555555的乘法逆是1/51/51/55−15^{-1}51,它满足方程:5−1⋅5=15^{-1} \cdot 5 = 1515=15⋅5−1=15 \cdot 5^{-1} = 1551=1,矩阵对逆的一般化也要求两个方程同时成立,所以当且仅当矩阵是方阵时,矩阵才有可能可逆(因为矩阵乘法要求左边矩阵的列等于右边矩阵的行,如果某个矩阵能同时满足左乘和右乘,那么只能是n×nn \times nn×n方阵)
定义:

一个n×nn \times nn×n矩阵AAA是可逆的,若存在一个n×nn \times nn×n矩阵CCC,使得:
CA=I CA = \boldsymbol I CA=I

AC=I AC = \boldsymbol I AC=I
其中I=In\boldsymbol I = \boldsymbol I_nI=Inn×nn \times nn×n单位矩阵。这时称CCCAAA的逆。

实际上,CCCAAA唯一确定,因为若BBB是另一个AAA的逆,那么将有B=BI=B(AC)=(BA)C=IC=CB=B \boldsymbol I = B(AC)=(BA)C=\boldsymbol I C = CB=BI=B(AC)=(BA)C=IC=C。于是,若AAA可逆,它的逆是唯一的,我们将它记为A−1A^{-1}A1,于是:
A−1A=IA^{-1}A = \boldsymbol IA1A=I

AA−1=IAA^{-1} = \boldsymbol IAA1=I
不可逆矩阵被称为奇异矩阵,而可逆矩阵也可称作非奇异矩阵
例:

A=[25−3−7]A=\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}A=[2357], C=[−7−532]C=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}C=[7352],则:
AC=[25−3−7][−7−532]=[1001] AC = \begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix} AC=[2357][7352]=[1001]
CA=[−7−532][25−3−7]=[1001] CA=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix} = \begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix} CA=[7352][2357]=[1001]
所以,C=A−1C=A^{-1}C=A1

行列式

定理:

A=[abcd]A = \begin{bmatrix}a & b \\ c & d\end{bmatrix}A=[acbd],若ad−bc≠0ad - bc \neq 0adbc=0,则AAA可逆且
A−1=1ad−bc[d−b−ca] A^{-1} = \frac{1}{ad-bc}\begin{bmatrix}d & -b \\ -c & a\end{bmatrix} A1=adbc1[dcba]
ad−bc=0ad - bc = 0adbc=0,则AAA不可逆

定理的证明可以通过上述逆矩阵的定义公式来进行。数ad−bcad-bcadbc称为AAA的行列式,记为:
det A=ad−bc det\,A = ad -bc detA=adbc
当且仅当det A≠0det\,A \neq 0detA=0时,上述2×22 \times 22×2矩阵AAA可逆。
例:

A=[3456]A=\begin{bmatrix}3 & 4 \\ 5 & 6\end{bmatrix}A=[3546]的逆

解:

因为det A=3(6)−4(5)=−2≠0det\,A = 3(6)-4(5)=-2 \neq 0detA=3(6)4(5)=2=0,所以AAA可逆,且:
A−1=1−2[6−4−53]=[−325/2−3/2]A^{-1} = \frac{1}{-2}\begin{bmatrix}6 & -4 \\ -5 & 3\end{bmatrix} = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}A1=21[6543]=[35/223/2]

可逆矩阵对应线性方程解的唯一性

定理:

AAA是可逆n×nn \times nn×n矩阵,则对每一Rn\mathbb R^nRn中的b\boldsymbol bb,方程Ax=bA\boldsymbol x = \boldsymbol bAx=b有唯一解x=A−1b\boldsymbol x = A^{-1}\boldsymbol bx=A1b

证明:

先证明A−1bA^{-1}\boldsymbol bA1b是方程的一个解:
因为AAA可逆,那么若以A−1bA^{-1} \boldsymbol bA1b代替x\boldsymbol xx,有:Ax=A(A−1b)=(AA−1)b=Ib=bA\boldsymbol x = A(A^{-1}\boldsymbol b) = (AA^{-1})\boldsymbol b = \boldsymbol I \boldsymbol b = \boldsymbol bAx=A(A1b)=(AA1)b=Ib=b,所以A−1bA^{-1}\boldsymbol bA1b是方程的一个解。
再证明解的唯一性:
假设u\boldsymbol uu是方程的任意一个解,那么有:Au=bA\boldsymbol u = \boldsymbol bAu=b,由于AAA可逆,那么方程两边同时乘以A−1A^{-1}A1得:A−1Au=A−1bA^{-1}A\boldsymbol u = A^{-1}\boldsymbol bA1Au=A1b,进一步推导有:Iu=A−1b\boldsymbol I \boldsymbol u = A^{-1}\boldsymbol bIu=A1b,也就是:u=A−1b\boldsymbol u = A^{-1}\boldsymbol bu=A1b
得证

上述定理很少用来解方程Ax=bA\boldsymbol x = \boldsymbol bAx=b,因为[Ab]\begin{bmatrix}A & \boldsymbol b\end{bmatrix}[Ab]的行化简通常更快。一个可能的例外是2×22 \times 22×2矩阵,因为这时利用行列式计算A−1A^{-1}A1相对比较容易。
例:

求解方程组:
3x1+4x2=35x1+6x2=7 \begin{aligned} 3x_1 + 4x_2 = 3 \\ 5x_1 + 6x_2 = 7 \end{aligned} 3x1+4x2=35x1+6x2=7

解:

x=A−1b=[−325/2−3/2][37]=[5−3] \boldsymbol x = A^{-1}\boldsymbol b = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}\begin{bmatrix}3 \\ 7\end{bmatrix} = \begin{bmatrix}5 \\ -3\end{bmatrix} x=A1b=[35/223/2][37]=[53]

可逆矩阵的几个性质

  1. AAA是可逆矩阵,则A−1A^{-1}A1也可逆而且(A−1)−1=A(A^{-1})^{-1} = A(A1)1=A
  2. AAABBB都是可逆矩阵,则ABABAB也可逆,且其逆是AAABBB的逆矩阵按相反顺序的乘积,即:(AB)−1=B−1A−1(AB)^{-1} = B^{-1}A^{-1}(AB)1=B1A1
  3. AAA可逆,则ATA^{T}AT也可逆,且其逆是A−1A^{-1}A1的转置,即(AT)−1=(A−1)T(A^{T})^{-1}=(A^{-1})^{T}(AT)1=(A1)T

简单证明上述第2个性质:

从逆矩阵定义出发,要证明B−1A−1B^{-1}A^{-1}B1A1ABABAB的逆矩阵,则要证明ABABAB左乘和右乘B−1A−1B^{-1}A^{-1}B1A1的积都是I\boldsymbol II。以右乘为例:(AB)(B−1A−1)=A(BB−1)A−1=AIA−1=AA−1=I(AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1} = A\boldsymbol IA^{-1} = AA^{-1} = \boldsymbol I(AB)(B1A1)=A(BB1)A1=AIA1=AA1=I。同理可以证明左乘的情况一样成立。

初等矩阵

定义:

单位矩阵进行一次初等行变换,就得到初等矩阵

例:

下面E1E_1E1是一个对应倍加变换的初等矩阵:
E1=[100010−401]E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix}E1=104010001
下面E2E_2E2是一个对应对换变换的初等矩阵:
E2=[010100001]E_2 = \begin{bmatrix}0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1\end{bmatrix}E2=010100001
下面E3E_3E3是一个对应倍乘变换的初等矩阵:
E3=[100010005]E_3=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 5\end{bmatrix}E3=100010005
假设有一个矩阵A=[abcdefghi]A=\begin{bmatrix}a & b & c \\ d & e & f \\ g & h & i\end{bmatrix}A=adgbehcfi,观察E1AE_1AE1AE2AE_2AE2AE3AE_3AE3A所起的作用。

解:

经过计算可知:
E1A=[abcdefg−4ah−4ai−4c]E_1A = \begin{bmatrix}a & b & c \\ d & e & f \\g-4a & h-4a & i-4c \end{bmatrix}E1A=adg4abeh4acfi4c
E2A=[defabcghi]E_2A=\begin{bmatrix}d & e & f \\ a & b & c \\ g & h & i \end{bmatrix}E2A=dagebhfci
E3A=[abcdef5g5h5i]E_3A=\begin{bmatrix}a & b & c \\ d & e & f \\5g & 5h & 5i \end{bmatrix}E3A=ad5gbe5hcf5i
从上述可知,这些乘积可由AAA进行EiE_iEi暗含的初等行变换得到。

还需注意:

  1. 3×n3 \times n3×n矩阵左乘以(即在左边相乘)上述EiE_iEi,均会产生相应的效果。
  2. 特别地,EiI=EiE_i \boldsymbol I = E_iEiI=Ei,也就是说,EiE_iEi本身是把单位矩阵以同一行变换作用所得。
    因此可以得到如下的一般结论:

若对m×nm \times nm×n矩阵AAA进行某种初等行变换,所得矩阵可写成EAEAEA,其中EEEm×mm \times mm×m矩阵,是由Im\boldsymbol I_mIm进行统一行变换所得。

因为行变换是可逆的,故初等矩阵也是可逆的。若EEE是由I\boldsymbol II进行行变换所得,则有同一类型的另一行变换把EEE变回I\boldsymbol II。因此,由初等矩阵FFF,使得FE=IFE = \boldsymbol IFE=I。因为EEEFFF对应于互逆的变换,所以也有EF=IEF=\boldsymbol IEF=I

每个初等矩阵EEE是可逆的,EEE的逆是一个同类型的初等矩阵,它把EEE变回I\boldsymbol II

例:

E1=[100010−401]E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix}E1=104010001的逆。

解:

为把E1E_1E1变成I\boldsymbol II,需要把第1行的4倍加到第3行,这相应于初等矩阵:
F=E1−1=[100010401] F = E_1^{-1}=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 4 & 0 & 1\end{bmatrix} F=E11=104010001

矩阵可逆的判定以及逆矩阵的计算方法

定理:

n×nn \times nn×n矩阵AAA是可逆的,当且仅当AAA行等价于In\boldsymbol I_nIn,这时,把AAA化简为In\boldsymbol I_nIn的一系列初等行比那换同时把In\boldsymbol I_nIn变成A−1A^{-1}A1

证明:

AAA是可逆矩阵,则对任意b\boldsymbol bb,方程Ax=bA\boldsymbol x = \boldsymbol bAx=b有解(参照本文前半段的定理),这就说明,AAA在每一行有一个主元位置。又因为AAA是方阵,所以这nnn个主元位置必在对角线上,相应的,AAA的简化阶梯形是In\boldsymbol I_nIn,即A∼InA \sim \boldsymbol I_nAIn
反之,若A∼InA \sim \boldsymbol I_nAIn,则因为每一步行化简对应于左乘一个初等矩阵,所以存在初等矩阵E1,⋯ ,EpE_1, \cdots, E_pE1,,Ep,使得:
A∼E1A∼E2(E1A)∼⋯∼Ep(Ep−1⋯E1A)=In A \sim E_1A \sim E_2(E_1A) \sim \cdots \sim E_p(E_{p-1} \cdots E_1A)=\boldsymbol I_n AE1AE2(E1A)Ep(Ep1E1A)=In
即:
EpEp−1⋯E1A=In E_pE_{p-1} \cdots E_1A=\boldsymbol I_n EpEp1E1A=In
因为Ep⋯E1E_p \cdots E_1EpE1是可逆矩阵的乘积,因此其也是可逆矩阵(这点可以参考上述的两点知识:1. 初等矩阵是可逆的;2. 如果两个矩阵是可逆的,那么两个矩阵的乘积也是可逆的),那么可以根据上式推出:
(Ep⋯E1)−1(Ep⋯E1)A=(Ep⋯E1)−1InA=(Ep⋯E1)−1 \begin{aligned} (E_p \cdots E_1)^{-1}(E_p \cdots E_1)A &= (E_p \cdots E_1)^{-1}\boldsymbol I_n \\ A &= (E_p \cdots E_1)^{-1} \end{aligned} (EpE1)1(EpE1)AA=(EpE1)1In=(EpE1)1
这说明了AAA是可逆矩阵Ep⋯E1E_p \cdots E_1EpE1的逆,又由于上述定理所述(可逆矩阵的逆矩阵也可逆),有:
A−1=[(Ep⋯E1)−1]−1=Ep⋯E1 A^{-1} = [(E_p \cdots E_1)^{-1}]^{-1} = E_p \cdots E_1 A1=[(EpE1)1]1=EpE1

由上述定理的证明过程,自然而然可以引出计算矩阵逆矩阵的一种方法:

AAAI\boldsymbol II排在一起构成增广矩阵[AI]\begin{bmatrix}A & \boldsymbol I\end{bmatrix}[AI],则对此矩阵进行行变换时,AAAI\boldsymbol II收到同一变换。要么有一系列的行变换把AAA变成I\boldsymbol II,同时把I\boldsymbol II变成A−1A^{-1}A1,要么AAA是不可逆的。

精确描述如下:

把增广矩阵[AI]\begin{bmatrix}A & \boldsymbol I\end{bmatrix}[AI]进行行化简。若AAA行等价于I\boldsymbol II,则[AI]\begin{bmatrix}A & \boldsymbol I\end{bmatrix}[AI]行等价于[IA−1]\begin{bmatrix}\boldsymbol I & A^{-1}\end{bmatrix}[IA1],否则AAA没有逆。

例:

求矩阵A=[0121034−38]A = \begin{bmatrix}0 & 1 & 2 \\ 1 & 0 & 3 \\ 4 & -3 & 8\end{bmatrix}A=014103238的逆,假如它存在。

解:

[AI]=[0121001030104−38001]∼[100−9/27−3/2010−24−10013/2−21/2] \begin{aligned} \begin{bmatrix}A & \boldsymbol I\end{bmatrix} &=\begin{bmatrix}0 & 1 & 2 & 1 & 0 & 0 \\ 1 & 0 & 3 & 0 & 1 & 0 \\4 & -3 & 8 & 0 & 0 & 1\end{bmatrix} \\ &\sim \begin{bmatrix}1 & 0 & 0 & -9/2 & 7 & -3/2 \\ 0 & 1 & 0 & -2 & 4 & -1\\ 0 & 0 & 1 & 3/2 & -2 & 1/2\end{bmatrix} \end{aligned} [AI]=0141032381000100011000100019/223/27423/211/2
由上述定理,可知AAA可逆,且:
A−1=[−9/27−3/2−24−13/2−21/2] A^{-1} = \begin{bmatrix}-9/2 & 7 & -3/2 \\ -2 & 4 & -1 \\3/2 & -2 & 1/2\end{bmatrix} A1=9/223/27423/211/2

可逆矩阵的另一个观点

假设AAA可逆,那么有:AA−1=IAA^{-1} = \boldsymbol IAA1=I。由矩阵乘法的定义,AAA乘以A−1A^{-1}A1,就是用AAA去乘以A−1A^{-1}A1的每一列。假设A−1A^{-1}A1的每一行按序号为xi\boldsymbol x_ixi,那么有:[Ax1Ax2⋯Axn]=[e1e2⋯en]\begin{bmatrix}A\boldsymbol x_1 & A\boldsymbol x_2 & \cdots & A\boldsymbol x_n\end{bmatrix} = \begin{bmatrix}\boldsymbol e_1 & \boldsymbol e_2 & \cdots & \boldsymbol e_n \end{bmatrix}[Ax1Ax2Axn]=[e1e2en]。要求解逆矩阵A−1A^{-1}A1的某一列xi\boldsymbol x_ixi,只需要求解方程
Axi=ei A\boldsymbol x_i = \boldsymbol e_i Axi=ei
即可。这一点是很有用的,因为在某些问题中,只需要A−1A^{-1}A1的一列或两列。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐