2.2 矩阵的逆(第2章矩阵代数)
内容概述本章首先由倒数的概念,引申出逆矩阵的概念。接着讲解了利用行列式来计算二阶方阵逆矩阵的方法。接下来,讲解了可逆矩阵对应线性方程解的唯一性,以及可逆矩阵的几个有用的性质。本章的最后,讲解了计算逆矩阵的一种通用方法,即利用初等矩阵来计算逆矩阵。由倒数引申出矩阵的逆假设有一个实数555,555的乘法逆是1/51/51/5或5−15^{-1}5−1,它满足方程:5−1⋅5=15^{-1} \c...
内容概述
本章首先由倒数的概念,引申出逆矩阵的概念。接着讲解了利用行列式来计算二阶方阵逆矩阵的方法。接下来,讲解了可逆矩阵对应线性方程解的唯一性,以及可逆矩阵的几个有用的性质。本章的最后,讲解了计算逆矩阵的一种通用方法,即利用初等矩阵来计算逆矩阵。
由倒数引申出矩阵的逆
假设有一个实数555,555的乘法逆是1/51/51/5或5−15^{-1}5−1,它满足方程:5−1⋅5=15^{-1} \cdot 5 = 15−1⋅5=1和5⋅5−1=15 \cdot 5^{-1} = 15⋅5−1=1,矩阵对逆的一般化也要求两个方程同时成立,所以当且仅当矩阵是方阵时,矩阵才有可能可逆(因为矩阵乘法要求左边矩阵的列等于右边矩阵的行,如果某个矩阵能同时满足左乘和右乘,那么只能是n×nn \times nn×n方阵)
定义:
一个n×nn \times nn×n矩阵AAA是可逆的,若存在一个n×nn \times nn×n矩阵CCC,使得:
CA=I CA = \boldsymbol I CA=I
且
AC=I AC = \boldsymbol I AC=I
其中I=In\boldsymbol I = \boldsymbol I_nI=In是n×nn \times nn×n单位矩阵。这时称CCC是AAA的逆。
实际上,CCC由AAA唯一确定,因为若BBB是另一个AAA的逆,那么将有B=BI=B(AC)=(BA)C=IC=CB=B \boldsymbol I = B(AC)=(BA)C=\boldsymbol I C = CB=BI=B(AC)=(BA)C=IC=C。于是,若AAA可逆,它的逆是唯一的,我们将它记为A−1A^{-1}A−1,于是:
A−1A=IA^{-1}A = \boldsymbol IA−1A=I
且
AA−1=IAA^{-1} = \boldsymbol IAA−1=I
不可逆矩阵被称为奇异矩阵,而可逆矩阵也可称作非奇异矩阵。
例:
若A=[25−3−7]A=\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}A=[2−35−7], C=[−7−532]C=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}C=[−73−52],则:
AC=[25−3−7][−7−532]=[1001] AC = \begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix} AC=[2−35−7][−73−52]=[1001]
CA=[−7−532][25−3−7]=[1001] CA=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix} = \begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix} CA=[−73−52][2−35−7]=[1001]
所以,C=A−1C=A^{-1}C=A−1
行列式
定理:
设A=[abcd]A = \begin{bmatrix}a & b \\ c & d\end{bmatrix}A=[acbd],若ad−bc≠0ad - bc \neq 0ad−bc=0,则AAA可逆且
A−1=1ad−bc[d−b−ca] A^{-1} = \frac{1}{ad-bc}\begin{bmatrix}d & -b \\ -c & a\end{bmatrix} A−1=ad−bc1[d−c−ba]
若ad−bc=0ad - bc = 0ad−bc=0,则AAA不可逆
定理的证明可以通过上述逆矩阵的定义公式来进行。数ad−bcad-bcad−bc称为AAA的行列式,记为:
det A=ad−bc det\,A = ad -bc detA=ad−bc
当且仅当det A≠0det\,A \neq 0detA=0时,上述2×22 \times 22×2矩阵AAA可逆。
例:
求A=[3456]A=\begin{bmatrix}3 & 4 \\ 5 & 6\end{bmatrix}A=[3546]的逆
解:
因为det A=3(6)−4(5)=−2≠0det\,A = 3(6)-4(5)=-2 \neq 0detA=3(6)−4(5)=−2=0,所以AAA可逆,且:
A−1=1−2[6−4−53]=[−325/2−3/2]A^{-1} = \frac{1}{-2}\begin{bmatrix}6 & -4 \\ -5 & 3\end{bmatrix} = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}A−1=−21[6−5−43]=[−35/22−3/2]
可逆矩阵对应线性方程解的唯一性
定理:
若AAA是可逆n×nn \times nn×n矩阵,则对每一Rn\mathbb R^nRn中的b\boldsymbol bb,方程Ax=bA\boldsymbol x = \boldsymbol bAx=b有唯一解x=A−1b\boldsymbol x = A^{-1}\boldsymbol bx=A−1b
证明:
先证明A−1bA^{-1}\boldsymbol bA−1b是方程的一个解:
因为AAA可逆,那么若以A−1bA^{-1} \boldsymbol bA−1b代替x\boldsymbol xx,有:Ax=A(A−1b)=(AA−1)b=Ib=bA\boldsymbol x = A(A^{-1}\boldsymbol b) = (AA^{-1})\boldsymbol b = \boldsymbol I \boldsymbol b = \boldsymbol bAx=A(A−1b)=(AA−1)b=Ib=b,所以A−1bA^{-1}\boldsymbol bA−1b是方程的一个解。
再证明解的唯一性:
假设u\boldsymbol uu是方程的任意一个解,那么有:Au=bA\boldsymbol u = \boldsymbol bAu=b,由于AAA可逆,那么方程两边同时乘以A−1A^{-1}A−1得:A−1Au=A−1bA^{-1}A\boldsymbol u = A^{-1}\boldsymbol bA−1Au=A−1b,进一步推导有:Iu=A−1b\boldsymbol I \boldsymbol u = A^{-1}\boldsymbol bIu=A−1b,也就是:u=A−1b\boldsymbol u = A^{-1}\boldsymbol bu=A−1b
得证
上述定理很少用来解方程Ax=bA\boldsymbol x = \boldsymbol bAx=b,因为[Ab]\begin{bmatrix}A & \boldsymbol b\end{bmatrix}[Ab]的行化简通常更快。一个可能的例外是2×22 \times 22×2矩阵,因为这时利用行列式计算A−1A^{-1}A−1相对比较容易。
例:
求解方程组:
3x1+4x2=35x1+6x2=7 \begin{aligned} 3x_1 + 4x_2 = 3 \\ 5x_1 + 6x_2 = 7 \end{aligned} 3x1+4x2=35x1+6x2=7
解:
x=A−1b=[−325/2−3/2][37]=[5−3] \boldsymbol x = A^{-1}\boldsymbol b = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}\begin{bmatrix}3 \\ 7\end{bmatrix} = \begin{bmatrix}5 \\ -3\end{bmatrix} x=A−1b=[−35/22−3/2][37]=[5−3]
可逆矩阵的几个性质
- 若AAA是可逆矩阵,则A−1A^{-1}A−1也可逆而且(A−1)−1=A(A^{-1})^{-1} = A(A−1)−1=A
- 若AAA和BBB都是可逆矩阵,则ABABAB也可逆,且其逆是AAA和BBB的逆矩阵按相反顺序的乘积,即:(AB)−1=B−1A−1(AB)^{-1} = B^{-1}A^{-1}(AB)−1=B−1A−1
- 若AAA可逆,则ATA^{T}AT也可逆,且其逆是A−1A^{-1}A−1的转置,即(AT)−1=(A−1)T(A^{T})^{-1}=(A^{-1})^{T}(AT)−1=(A−1)T
简单证明上述第2个性质:
从逆矩阵定义出发,要证明B−1A−1B^{-1}A^{-1}B−1A−1是ABABAB的逆矩阵,则要证明ABABAB左乘和右乘B−1A−1B^{-1}A^{-1}B−1A−1的积都是I\boldsymbol II。以右乘为例:(AB)(B−1A−1)=A(BB−1)A−1=AIA−1=AA−1=I(AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1} = A\boldsymbol IA^{-1} = AA^{-1} = \boldsymbol I(AB)(B−1A−1)=A(BB−1)A−1=AIA−1=AA−1=I。同理可以证明左乘的情况一样成立。
初等矩阵
定义:
把单位矩阵进行一次初等行变换,就得到初等矩阵。
例:
下面E1E_1E1是一个对应倍加变换的初等矩阵:
E1=[100010−401]E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix}E1=⎣⎡10−4010001⎦⎤
下面E2E_2E2是一个对应对换变换的初等矩阵:
E2=[010100001]E_2 = \begin{bmatrix}0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1\end{bmatrix}E2=⎣⎡010100001⎦⎤
下面E3E_3E3是一个对应倍乘变换的初等矩阵:
E3=[100010005]E_3=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 5\end{bmatrix}E3=⎣⎡100010005⎦⎤
假设有一个矩阵A=[abcdefghi]A=\begin{bmatrix}a & b & c \\ d & e & f \\ g & h & i\end{bmatrix}A=⎣⎡adgbehcfi⎦⎤,观察E1AE_1AE1A,E2AE_2AE2A,E3AE_3AE3A所起的作用。
解:
经过计算可知:
E1A=[abcdefg−4ah−4ai−4c]E_1A = \begin{bmatrix}a & b & c \\ d & e & f \\g-4a & h-4a & i-4c \end{bmatrix}E1A=⎣⎡adg−4abeh−4acfi−4c⎦⎤
E2A=[defabcghi]E_2A=\begin{bmatrix}d & e & f \\ a & b & c \\ g & h & i \end{bmatrix}E2A=⎣⎡dagebhfci⎦⎤
E3A=[abcdef5g5h5i]E_3A=\begin{bmatrix}a & b & c \\ d & e & f \\5g & 5h & 5i \end{bmatrix}E3A=⎣⎡ad5gbe5hcf5i⎦⎤
从上述可知,这些乘积可由AAA进行EiE_iEi暗含的初等行变换得到。
还需注意:
- 把3×n3 \times n3×n矩阵左乘以(即在左边相乘)上述EiE_iEi,均会产生相应的效果。
- 特别地,EiI=EiE_i \boldsymbol I = E_iEiI=Ei,也就是说,EiE_iEi本身是把单位矩阵以同一行变换作用所得。
因此可以得到如下的一般结论:
若对m×nm \times nm×n矩阵AAA进行某种初等行变换,所得矩阵可写成EAEAEA,其中EEE是m×mm \times mm×m矩阵,是由Im\boldsymbol I_mIm进行统一行变换所得。
因为行变换是可逆的,故初等矩阵也是可逆的。若EEE是由I\boldsymbol II进行行变换所得,则有同一类型的另一行变换把EEE变回I\boldsymbol II。因此,由初等矩阵FFF,使得FE=IFE = \boldsymbol IFE=I。因为EEE和FFF对应于互逆的变换,所以也有EF=IEF=\boldsymbol IEF=I。
每个初等矩阵EEE是可逆的,EEE的逆是一个同类型的初等矩阵,它把EEE变回I\boldsymbol II。
例:
求E1=[100010−401]E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix}E1=⎣⎡10−4010001⎦⎤的逆。
解:
为把E1E_1E1变成I\boldsymbol II,需要把第1行的4倍加到第3行,这相应于初等矩阵:
F=E1−1=[100010401] F = E_1^{-1}=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 4 & 0 & 1\end{bmatrix} F=E1−1=⎣⎡104010001⎦⎤
矩阵可逆的判定以及逆矩阵的计算方法
定理:
n×nn \times nn×n矩阵AAA是可逆的,当且仅当AAA行等价于In\boldsymbol I_nIn,这时,把AAA化简为In\boldsymbol I_nIn的一系列初等行比那换同时把In\boldsymbol I_nIn变成A−1A^{-1}A−1
证明:
设AAA是可逆矩阵,则对任意b\boldsymbol bb,方程Ax=bA\boldsymbol x = \boldsymbol bAx=b有解(参照本文前半段的定理),这就说明,AAA在每一行有一个主元位置。又因为AAA是方阵,所以这nnn个主元位置必在对角线上,相应的,AAA的简化阶梯形是In\boldsymbol I_nIn,即A∼InA \sim \boldsymbol I_nA∼In。
反之,若A∼InA \sim \boldsymbol I_nA∼In,则因为每一步行化简对应于左乘一个初等矩阵,所以存在初等矩阵E1,⋯ ,EpE_1, \cdots, E_pE1,⋯,Ep,使得:
A∼E1A∼E2(E1A)∼⋯∼Ep(Ep−1⋯E1A)=In A \sim E_1A \sim E_2(E_1A) \sim \cdots \sim E_p(E_{p-1} \cdots E_1A)=\boldsymbol I_n A∼E1A∼E2(E1A)∼⋯∼Ep(Ep−1⋯E1A)=In
即:
EpEp−1⋯E1A=In E_pE_{p-1} \cdots E_1A=\boldsymbol I_n EpEp−1⋯E1A=In
因为Ep⋯E1E_p \cdots E_1Ep⋯E1是可逆矩阵的乘积,因此其也是可逆矩阵(这点可以参考上述的两点知识:1. 初等矩阵是可逆的;2. 如果两个矩阵是可逆的,那么两个矩阵的乘积也是可逆的),那么可以根据上式推出:
(Ep⋯E1)−1(Ep⋯E1)A=(Ep⋯E1)−1InA=(Ep⋯E1)−1 \begin{aligned} (E_p \cdots E_1)^{-1}(E_p \cdots E_1)A &= (E_p \cdots E_1)^{-1}\boldsymbol I_n \\ A &= (E_p \cdots E_1)^{-1} \end{aligned} (Ep⋯E1)−1(Ep⋯E1)AA=(Ep⋯E1)−1In=(Ep⋯E1)−1
这说明了AAA是可逆矩阵Ep⋯E1E_p \cdots E_1Ep⋯E1的逆,又由于上述定理所述(可逆矩阵的逆矩阵也可逆),有:
A−1=[(Ep⋯E1)−1]−1=Ep⋯E1 A^{-1} = [(E_p \cdots E_1)^{-1}]^{-1} = E_p \cdots E_1 A−1=[(Ep⋯E1)−1]−1=Ep⋯E1
由上述定理的证明过程,自然而然可以引出计算矩阵逆矩阵的一种方法:
把AAA和I\boldsymbol II排在一起构成增广矩阵[AI]\begin{bmatrix}A & \boldsymbol I\end{bmatrix}[AI],则对此矩阵进行行变换时,AAA和I\boldsymbol II收到同一变换。要么有一系列的行变换把AAA变成I\boldsymbol II,同时把I\boldsymbol II变成A−1A^{-1}A−1,要么AAA是不可逆的。
精确描述如下:
把增广矩阵[AI]\begin{bmatrix}A & \boldsymbol I\end{bmatrix}[AI]进行行化简。若AAA行等价于I\boldsymbol II,则[AI]\begin{bmatrix}A & \boldsymbol I\end{bmatrix}[AI]行等价于[IA−1]\begin{bmatrix}\boldsymbol I & A^{-1}\end{bmatrix}[IA−1],否则AAA没有逆。
例:
求矩阵A=[0121034−38]A = \begin{bmatrix}0 & 1 & 2 \\ 1 & 0 & 3 \\ 4 & -3 & 8\end{bmatrix}A=⎣⎡01410−3238⎦⎤的逆,假如它存在。
解:
[AI]=[0121001030104−38001]∼[100−9/27−3/2010−24−10013/2−21/2] \begin{aligned} \begin{bmatrix}A & \boldsymbol I\end{bmatrix} &=\begin{bmatrix}0 & 1 & 2 & 1 & 0 & 0 \\ 1 & 0 & 3 & 0 & 1 & 0 \\4 & -3 & 8 & 0 & 0 & 1\end{bmatrix} \\ &\sim \begin{bmatrix}1 & 0 & 0 & -9/2 & 7 & -3/2 \\ 0 & 1 & 0 & -2 & 4 & -1\\ 0 & 0 & 1 & 3/2 & -2 & 1/2\end{bmatrix} \end{aligned} [AI]=⎣⎡01410−3238100010001⎦⎤∼⎣⎡100010001−9/2−23/274−2−3/2−11/2⎦⎤
由上述定理,可知AAA可逆,且:
A−1=[−9/27−3/2−24−13/2−21/2] A^{-1} = \begin{bmatrix}-9/2 & 7 & -3/2 \\ -2 & 4 & -1 \\3/2 & -2 & 1/2\end{bmatrix} A−1=⎣⎡−9/2−23/274−2−3/2−11/2⎦⎤
可逆矩阵的另一个观点
假设AAA可逆,那么有:AA−1=IAA^{-1} = \boldsymbol IAA−1=I。由矩阵乘法的定义,AAA乘以A−1A^{-1}A−1,就是用AAA去乘以A−1A^{-1}A−1的每一列。假设A−1A^{-1}A−1的每一行按序号为xi\boldsymbol x_ixi,那么有:[Ax1Ax2⋯Axn]=[e1e2⋯en]\begin{bmatrix}A\boldsymbol x_1 & A\boldsymbol x_2 & \cdots & A\boldsymbol x_n\end{bmatrix} = \begin{bmatrix}\boldsymbol e_1 & \boldsymbol e_2 & \cdots & \boldsymbol e_n \end{bmatrix}[Ax1Ax2⋯Axn]=[e1e2⋯en]。要求解逆矩阵A−1A^{-1}A−1的某一列xi\boldsymbol x_ixi,只需要求解方程
Axi=ei A\boldsymbol x_i = \boldsymbol e_i Axi=ei
即可。这一点是很有用的,因为在某些问题中,只需要A−1A^{-1}A−1的一列或两列。
更多推荐


所有评论(0)