正定矩阵、正定二次型与正定函数

在最近学习的三门课程（最优化理论、线性系统、非线性系统）中，不时出现一个词——正定，有必要做一番剖析。一、正定矩阵1.1 正定矩阵定义与性质正定（positive definite）直译肯定是正的。简单说，就是正数的扩展。先来看个小栗子，首先看正定矩阵的定义与性质，定义为：若矩阵 AAA 是n 阶方阵，对于任意非零向量 xxx，都有xTAx>0{x^T}Ax > 0xTAx>0，

大强强小强强

8363人浏览 · 2020-12-15 10:41:14

大强强小强强 · 2020-12-15 10:41:14 发布

一、正定矩阵与正定函数

1.1 正定函数定义

[正定函数] 若实函数 $V (x)$ 对任意 n 维非零向量 $x$ 都有 $V (x) > 0$ ，当且仅当 $x = 0$ 时， $V (x) = 0$ ，则称函数 $V (x)$ 为正定函数。

[半正定函数] 如果 $\neq 0,V(x) \ge 0$ ，则称 $V (x)$ 为半正定函数。
[负定函数] 如果 $\neq 0, V(x) < 0$ ，则称 $V (x)$ 为负定函数。
[半负定函数] 如果 $\neq 0, V(x) \le 0$ ，则称 $V (x)$ 为半负定函数。

1.2 正定矩阵与正定二次型

若矩阵 $A$ 是n 阶方阵，对于任意非零向量 $x$ ，都有 ${x^T}Ax > 0$ ，则矩阵 $A$ 是正定矩阵，函数 ${x^T}Ax$ 称为矩阵 $A$ 对应的正定二次型。

半正定、负定和半负定以此类推，不再赘述。

例如：

$\left [ \begin{array}{cc} 1 & 0 \\ 0 & 1 \end{array} \right ]$

$\left [ \begin{array}{cc} x_1 & x_2 \end{array} \right ] A \left [ \begin{array}{cc} x_1 \\ x_2 \end{array} \right ] = x_1^2 + x_2^2 \tag{1.1}$

就是一个正定二次型。因为当且仅当 $x=[x_1, x_2]^T = [0, 0]^T$ 时， $V (x) = 0$ ，否则 $V (x) > 0$ ，满足定义。

而

$\left [ \begin{array}{cc} 1 & -1 \\ -1 & 1 \end{array} \right ]$

$(x_1 - x_2)^2 \tag{2.2}$

是一个半正定函数。因为 $\ge 0$ ，当 $x_1 = x_2$ 时， $V (x) = 0$ 。

1.3 二次型图像

正定二次型有个很好的性质——有唯一的全局最小值。

以二阶矩阵为例，分别绘制正定 $A_1$ 、半正定 $A_2$ 、负定 $A_3$ 、不定 $A_4$ 二次型的图像，对应的矩阵分别取：

$A1=[1001]A2=[1−1−11]A3=[−100−1]A4=[100−1]A_1 = \left [ \begin{array}{cc} 1 & 0 \\ 0 & 1 \end{array} \right ] \quad A_2 = \left [ \begin{array}{cc} 1 & -1 \\ -1 & 1 \end{array} \right ] \quad A_3 = \left [ \begin{array}{cc} -1 & 0 \\ 0 & -1 \end{array} \right ] \quad A_4 = \left [ \begin{array}{cc} 1 & 0\\ 0 & -1 \end{array} \right ]$

[x1, x2] = meshgrid(-2:0.1:2);
subplot(221);mesh(x1, x2, x1.^2 + x2.^2);               % A1 = [1 0; 0 1];
subplot(222);mesh(x1, x2, x1.^2 + x2.^2 - 2*x1.*x2);    % A2 = [1 -1; -1 1];
subplot(223);mesh(x1, x2, -x1.^2 - x2.^2);              % A3 = [-1 0; 0 -1];
subplot(224);mesh(x1, x2, x1.^2 - x2.^2);               % A4 = [1 0; 0 -1];

二次型

可见，二阶正定矩阵对应的二次型图像是一个开口朝上旋转抛物面，在原点处有唯一最小值。有唯一最小值是一个很好的性质，因为最优化问题往往就是计算一个最小值。

二、正定函数的应用

正定函数的一个应用就是著名的Lyapunov函数，常常希望找到正定的 $V (x)$ 和负定的 $V˙(x)\dot V(x)$ ，这样原系统就是稳定的。比如状态空间方程：

$\dot x = -x \tag{2.3}$

其中， $x$ 为系统的一个状态。选择
$\frac{1}{2}x^2 \tag{2.4}$

则：

$\dot V(x) = x\dot x = -x^2 \tag{2.5}$

$V (x)$ 正定， $V˙(x)\dot V(x)$ 负定，式(2.3) 表示的系统是稳定的。再看看式(2.1)，当 $x > 0$ 时， $x˙<0\dot x<0$ ， $x$ 将朝着原点移动； $x < 0$ 时， $x˙>0\dot x>0$ ， $x$ 依旧朝着原点移动。因此，如果 $x$ 代表着小球的位移，那么小球总会回到原点，说原点是稳定的理所当然。实际上，式子(2.4) 这个二次函数有着能量的含义，原点能量是最低的，小球总会滚到原点。再次看式(2.1)，其解为 $x=e^{-t}$ ，随着时间推移， $x$ 会不断趋近于 0，也可以看出 $x$ 是稳定的。可见，Lyapunov函数、原方程、原方程的解都能用来分析稳定性。但实际情况中，往往原方程不直观，原方程解很复杂甚至没有解析解，而Lyapunov函数设计可能更为方便（有时也并不容易），因此得到广泛运用。