一、正定矩阵与正定函数

1.1 正定函数定义

[正定函数] 若实函数 V(x)V(x)V(x) 对任意 n 维非零向量 xxx 都有 V(x)>0V(x)>0V(x)>0,当且仅当 x=0x=0x=0 时,V(x)=0V(x)=0V(x)=0,则称函数 V(x)V(x)V(x) 为正定函数。

[半正定函数] 如果 x≠0,V(x)≥0x \neq 0,V(x) \ge 0x=0,V(x)0,则称 V(x)V(x)V(x) 为半正定函数。
[负定函数] 如果 x≠0,V(x)<0x \neq 0, V(x) < 0x=0,V(x)<0,则称 V(x)V(x)V(x) 为负定函数。
[半负定函数] 如果 x≠0,V(x)≤0x \neq 0, V(x) \le 0x=0,V(x)0,则称 V(x)V(x)V(x) 为半负定函数。

1.2 正定矩阵与正定二次型

若矩阵 AAA 是n 阶方阵,对于任意非零向量 xxx,都有xTAx>0{x^T}Ax > 0xTAx>0,则矩阵 AAA 是正定矩阵,函数 xTAx{x^T}AxxTAx 称为矩阵 AAA 对应的正定二次型。

半正定、负定和半负定以此类推,不再赘述。

例如:

A=[1001] A = \left [ \begin{array}{cc} 1 & 0 \\ 0 & 1 \end{array} \right ] A=[1001]

V(x)=[x1x2]A[x1x2]=x12+x22(1.1) V(x) = \left [ \begin{array}{cc} x_1 & x_2 \end{array} \right ] A \left [ \begin{array}{cc} x_1 \\ x_2 \end{array} \right ] = x_1^2 + x_2^2 \tag{1.1} V(x)=[x1x2]A[x1x2]=x12+x22(1.1)

就是一个正定二次型。因为当且仅当 x=[x1,x2]T=[0,0]Tx=[x_1, x_2]^T = [0, 0]^Tx=[x1,x2]T=[0,0]T 时,V(x)=0V(x)=0V(x)=0,否则 V(x)>0V(x)>0V(x)>0,满足定义。

A=[1−1−11] A = \left [ \begin{array}{cc} 1 & -1 \\ -1 & 1 \end{array} \right ] A=[1111]

V(x)=(x1−x2)2(2.2) V(x) = (x_1 - x_2)^2 \tag{2.2} V(x)=(x1x2)2(2.2)

是一个半正定函数。因为 V(x)≥0V(x) \ge 0V(x)0,当 x1=x2x_1 = x_2x1=x2 时,V(x)=0V(x) = 0V(x)=0

1.3 二次型图像

正定二次型有个很好的性质——有唯一的全局最小值。

以二阶矩阵为例,分别绘制正定A1A_1A1、半正定A2A_2A2、负定A3A_3A3、不定A4A_4A4二次型的图像,对应的矩阵分别取:

A1=[1001]A2=[1−1−11]A3=[−100−1]A4=[100−1]A_1 = \left [ \begin{array}{cc} 1 & 0 \\ 0 & 1 \end{array} \right ] \quad A_2 = \left [ \begin{array}{cc} 1 & -1 \\ -1 & 1 \end{array} \right ] \quad A_3 = \left [ \begin{array}{cc} -1 & 0 \\ 0 & -1 \end{array} \right ] \quad A_4 = \left [ \begin{array}{cc} 1 & 0\\ 0 & -1 \end{array} \right ] A1=[1001]A2=[1111]A3=[1001]A4=[1001]

[x1, x2] = meshgrid(-2:0.1:2);
subplot(221);mesh(x1, x2, x1.^2 + x2.^2);               % A1 = [1 0; 0 1];
subplot(222);mesh(x1, x2, x1.^2 + x2.^2 - 2*x1.*x2);    % A2 = [1 -1; -1 1];
subplot(223);mesh(x1, x2, -x1.^2 - x2.^2);              % A3 = [-1 0; 0 -1];
subplot(224);mesh(x1, x2, x1.^2 - x2.^2);               % A4 = [1 0; 0 -1];

二次型

可见,二阶正定矩阵对应的二次型图像是一个开口朝上旋转抛物面,在原点处有唯一最小值。有唯一最小值是一个很好的性质,因为最优化问题往往就是计算一个最小值。


二、正定函数的应用

正定函数的一个应用就是著名的Lyapunov函数,常常希望找到正定的 V(x)V(x)V(x) 和 负定的 V˙(x)\dot V(x)V˙(x),这样原系统就是稳定的。比如状态空间方程:

x˙=−x(2.3) \dot x = -x \tag{2.3} x˙=x(2.3)

其中,xxx 为系统的一个状态。选择
V(x)=12x2(2.4)V(x) = \frac{1}{2}x^2 \tag{2.4} V(x)=21x2(2.4)

则:

V˙(x)=xx˙=−x2(2.5) \dot V(x) = x\dot x = -x^2 \tag{2.5} V˙(x)=xx˙=x2(2.5)

V(x)V(x)V(x) 正定,V˙(x)\dot V(x)V˙(x) 负定,式(2.3) 表示的系统是稳定的。再看看式(2.1),当 x>0x>0x>0 时,x˙<0\dot x<0x˙<0xxx 将朝着原点移动;x<0x<0x<0 时,x˙>0\dot x>0x˙>0xxx 依旧朝着原点移动。因此,如果 xxx 代表着小球的位移,那么小球总会回到原点,说原点是稳定的理所当然。实际上,式子(2.4) 这个二次函数有着能量的含义,原点能量是最低的,小球总会滚到原点。再次看式(2.1),其解为 x=e−tx=e^{-t}x=et,随着时间推移,xxx 会不断趋近于 0,也可以看出 xxx 是稳定的。可见,Lyapunov函数、原方程、原方程的解都能用来分析稳定性。但实际情况中,往往原方程不直观,原方程解很复杂甚至没有解析解,而Lyapunov函数设计可能更为方便(有时也并不容易),因此得到广泛运用。

最后再感悟一下正定函数的美妙性。V(x)>0V(x)>0V(x)>0V˙(x)<0\dot V(x)<0V˙(x)<0 这个条件实在太强了,保证了某点领域内有唯一的最小值。如果对全部的 xxx 都成立,那么该点就是全局的最小值点,也就是全局稳定的。

— 完 —

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐