【OR】约束优化：二阶充分条件

约束优化：二阶充分条件

minuxAE

3426人浏览 · 2020-08-14 15:19:47

minuxAE · 2020-08-14 15:19:47 发布

二阶充分条件

当问题 $(P)$ 中约束规范
(1) $g_i(x), i=1, 2,\dots, m$ 均为凸函数
(2) $h_i(x)，i=1,\dots, I$ 为线性函数
满足KKT条件的点是 $(P)$ 的最优解.
考虑如果 $(1)$ 或者 $(2)$ 无法满足时，最优解的条件，需要使用二阶信息.
设 $x^*$ 满足KKT条件
$\left\{ \begin{aligned} &\nabla f(x^*)+\sum\lambda_i\nabla g_i(x^*)+\sum\mu_i\nabla h_i(x^*)=0\\ &\lambda_i\geq 0\\ &\lambda_ig_i(x^*)=0 \end{aligned} \right.$
建立拉格朗日函数 $L (x)$ , 令
$L(x)=f(x)+\sum_i\lambda_ig_i(x)+\sum_i\mu_ih_i(x)$
可以得到
$\begin{aligned} &\nabla L(x^*)=\nabla f(x^*)+\sum\lambda_i\nabla g_i(x^*)+\sum\mu_i\nabla h_i(x^*)=0\\ &L(x^*)=f(x^*)+\sum\lambda_ig_i(x^*)+\sum\mu_ih_i(x^*)=f(x^*)\\ &\forall x\in S, L(x)=f(x)+\sum\underbrace{\lambda_ig_i(x)}_{\leq 0}+\sum\underbrace{\mu_ih_i(x)}_{=0}\Rightarrow L(x)\leq f(x) \end{aligned}$
可以知道，如果 $x^*$ 是 $L (x)$ 的最优解，则 $x^*$ 是 $(P)$ 的最优解.

1.设 $x^*$ 是KKT点， $\lambda, \mu, L(x)，\nabla L(x^*)=0$
(1). 如果 $\nabla^2L(x)\succeq 0, \forall x\in S$ ，则 $x^*$ 是 $L (x)$ 的全局最优解，也是 $(P)$ 的全局最优解.
(2). 如果 $\nabla^2L(x)\succeq 0, \forall x\in S\cap N_s(x^*)$ ，则 $x^*$ 是局部最优解.
(3). 如果 $\nabla^2L(x)\succ 0$ , 则 $x^*$ 是 $(P)$ 问题的严格局部最优解， $d^T\nabla^2L(x^*)d>0， \forall d\neq 0$ 任何一个方向都会使函数值上升.
设 $d^T\nabla^2L(x^*)d>0, \forall d\in F_1(x^*)$
$F_1(x^*)=\left\{ d\Bigg| \begin{cases} \nabla g_i(x^*)^Td\leq 0, i\in I\\ \nabla h_i(x^*)^Td=0, i=1, 2, \dots, l \end{cases} \right\}$
$F_1(x^*)$ 中目标函数值会上升的方向需要去除，考虑 $\lambda_i$ ，根据敏感系数 $\lambda_i$ 的定义，在 $\lambda_i>0$ 的情况下， $g_i(x)\leq 0, g_i(x^*)=0$ ，所以在 $x^*\to x$ 方向上有
$\nabla g_i(x^*)^Td<0$
令
$\begin{aligned} I^+=\{i\mid \lambda_i>0, i\in I\}\\ I^0=\{i\mid \lambda_i=0, i\in I\} \end{aligned}$
子集合 $F_2(x)$
$F_2(x^*)=\left\{d\Bigg| \begin{aligned} &\nabla g_i(x^*)\leq 0, i\in I^0\\ &g_i(x^*)^Td=0, i\in I^+\\ &\nabla h_i(x^*)^Td=0, i=1, 2\dots, l \end{aligned} \right\}\subset F_1(x^*)$

定理

假设 $x^*$ 满足KKT条件， $\lambda, \mu, L(x)=f(x)+\sum\lambda_ig_i(x)+\mu_ih_i(x)$ 可以知道 $\nabla L(x^*)=0$ , 已知 $d^T\nabla^2L(x^*)d>0, \forall d\in F_2(x^*)$ .
则 $x^*$ 是 $(P)$ 问题的严格局部最优解.
证明：
使用反证法，设 $x^*$ 不是严格局部最优解，则存在点列 $x_k\to x^*， x_k\in S， f(x_k)\leq f(x^*)$ ，如果可以找打方向 $d\in F_2$ ，但是 $d^T\nabla^2L(x^*)d\leq 0$ 则定理不成立.
记
$d_k=\frac{x_k-x^*}{\lVert x_k-x^*\rVert}\\ \alpha_k=\lVert x_k-x^*\rVert$
显然， $\{\alpha_k\}\to 0$ 且 ${d_k\}$ 有界， $x_k=x^*+\alpha_kd_k$
计算
$\begin{aligned} &f(x_k)-f(x^*)=\alpha_k\nabla f(x^*)^Td_k+\frac{\alpha_k^2}{2}d_k^T\nabla^2f(x^*)d_k+\mathcal{o}(\alpha_k^2)\leq 0 \quad (1)\\ &g_i(x_k)-g_i(x^*)=\alpha_k\nabla g_i(x^*)^Td_k+\frac{\alpha_k^2}{2}d_k^T\nabla^2g_i(x^*)d_k+\mathcal{o}(\alpha_k^2)\leq 0, i\in I \quad (2)\\ &h_i(x_k)-h_i(x^*)=\alpha_k\nabla h_i(x^*)d_k+\frac{\alpha_k^2}{2}d_k^T\nabla^2h_i(x^*)d_k+\mathcal{o}(\alpha_k^2)= 0, i=1, 2\dots, l \quad (3) \end{aligned}$
对方程(1)，除以 $\alpha_k$ ，令 $k\to \infty$ ，得到
$\nabla f(x^*)^Td_k\leq 0$
对方程(2)，除以 $\alpha_k$ ，令 $k\to \infty$ ，得到
$\nabla g_i(x^*)^Td_k\leq 0$
对方程(3)，除以 $\alpha_k$ ，令 $k\to \infty$ ，得到
$\nabla h_i(x^*)^Td_k=0$
由KKT条件（两边同时乘以 $d$ ）可以得到
$\underbrace{\nabla f(x^*)^Td}_{\leq 0}+\sum\underbrace{\lambda_i\nabla g_i(x^*)^Td}_{\leq 0}+\sum\underbrace{\mu_i\nabla h_i(x^*)^Td}_{=0}=0$
所以可以得到
$\nabla f(x^*)^Td=0 \tag{3}\\$
$\sum\lambda_i\nabla g_i(x^*)^Td=0 \tag{4}$
由方程 $(4)$ 可以得到
$\begin{aligned} &\nabla g_i(x^*)^Td=0, i\in I^+\\ &\nabla g_i(x^*)^Td\leq 0, i \in I^0 \\ &\nabla h_i(x^*)^Td=0 \end{aligned}$
即 $d\in F_2(x^*)$
计算 $(1)+\sum \lambda_i *(2)+\sum \mu_i *(3)$
$\begin{aligned} &\alpha_k\nabla f(x^*)^Td_k+\sum \lambda_i\nabla g_i(x^*)^Td_k+\sum \mu_i\nabla h_i(x^*)^Td_k+\\ &\frac{\alpha_k^2}{2}(d_k^T\nabla^2 f(x_k^*)d_k+\sum\lambda_id_k^T\nabla^2g_i(x^*)d_k+\sum\mu_i d_k^T\nabla^2 h_i(x^*)d_k)+\mathcal{o}(\alpha_k^2)\leq 0 \end{aligned}$
整理可得
$\begin{aligned} &\underbrace{\alpha_k(\nabla f(x^*)+\sum \lambda_i\nabla g_i(x^*)+\sum\mu_i \nabla h_i(x^*))^Td_k}_{=0}+\\ &\frac{\alpha_k^2}{2}d_k^T\nabla^2L(x^*)d_k+\mathcal{o}(\alpha_k^2)\leq 0 \end{aligned}$
即
$\frac{1}{2}d_k^T\nabla^2L(x^*)d_k+\frac{\mathcal{o}(\alpha_k^2)}{\alpha_k^2}\leq 0$
令 $k\to\infty$ ，可知 $\exist d\in F_2(x^*)$ ，使 $d^T\nabla^2L(x^*)d\leq 0$ .与已知条件矛盾.
综上， $x^*$ 是 $(P)$ 的严格局部最优解.

参考资料

约束优化理论 lecture 9. 崔雪婷

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI 算力加速指南：Figma AI/Canva AI 全场景优化，从 “闪退卡顿” 到 “流畅创作”（一）

2048 AI社区

用 AI 搭 AI 导航页：老框架 ThinkPHP 与新工具的协作笔记

2048 AI社区

Python 生成器与迭代器：节省内存的代码实现技巧

await async2() // 这一句会同步执行，返回 Promise ，其中的 `console.log('async2')` 也会同步执行。Promise.resolve().then(() => { // 返回 rejected 状态的 promise。Promise.resolve().then(() => { // 返回 rejected 状态的 promise。console.lo