双层优化模型【简述】

1.模型理解双层规划问题就是指这种优化问题：目标函数中的一组变量被约束为另一优化问题的最优解；更简单来说，就是一个优化问题问题的参数受限于另一个优化问题，这两个问题相互影响。2.数学定义公式定义：minθ,wθF(wθ,θ)suchthatwθ∈minwL(w,θ)min_{\theta,w_\theta}F(w_\theta,\theta) \quad such \quad that \quad

一只小菜鸡~

18658人浏览 · 2022-05-07 11:42:10

一只小菜鸡~ · 2022-05-07 11:42:10 发布

1.模型理解

双层规划问题就是指这种优化问题：目标函数中的一组变量被约束为另一优化问题的最优解；更简单来说，就是一个优化问题问题的参数受限于另一个优化问题，这两个问题相互影响。

2.数学定义

公式定义：
$min_{\theta,w_\theta}F(w_\theta,\theta) \quad such \quad that \quad w_\theta \in min_wL(w,\theta)$
其中

$F(w_\theta,\theta)$ ：外部优化问题的目标函数
$L(w,\theta)$ ：内部优化问题的目标函数
$\theta$ ：外部变量/超参数
w：内部变量

解释

针对上述公式，我们的最终目的其实是求 $F (W θ, θ)$ 的最小值，但是它其中的一个参数 $w_θ$ 是关于另一个问题， $L (w, θ)$ 解的函数
上面的目标函数 F 和 L可以通俗理解为训练网络的时候，使用的损失函数，比如说网络预测值与真实值差值的平方和
在机器学习中，有一类应用是通过双层规划问题来优化超参数，超参数优化问题的基本思想是在给定一个度量标准的情况下，使用验证集构建一个超参数的响应函数（eg:验证集上的平均损失）
在2的这种情况下，一般外部目标函数 $F (W θ, θ)$ 是基于验证集的，而内部目标函数 $L (w, θ)$ 是基于训练集的。这样设置的一个直观的解释是：内部目标函数通过采用训练集样本不断优化内部变量，也就是不断优化网络各层的参数w；而外部目标函数则通过验证集样本不断优化外部变量，也就是优化超参数。

3.一种求解思路

求解双层规划问题是比较困难的，因为内部优化问题一般是很难找到其闭合解（也成为解析解，即存在严格的公式，给定 x 就能求出 y ）。一种求解双层规划问题的思路是：

固定外层超参数，优化内层参数：将内部优化问题的求解看做是一个迭代优化的过程，使用梯度下降或者各类变体算法近似求解内层目标函数的解，及使用下列公式进行多次梯度下降优化w，假设经过T次梯度下降后，得到内层优化问题的近似解 $W θ, T$

$W_t=\Phi(w_{t-1},\theta)=w_{t-1}-\eta \nabla L(w_{t-1},\theta),t=1,2,3,....,T$
固定内层超参数，优化外层超参数：在获得内层近似解之后，针对外层也采用梯度下降优化超参数，计算外层目标函数对超参数θ的导数（公式3所示），然后更新超参数（公式4所示）

$\nabla_{\theta}F(w_\theta,\theta)=\alpha_wF(w_\theta,T,\theta)\nabla_{\theta w_\theta,T}+\alpha_\theta F(w_\theta,T,\theta) (3) \\\theta=\theta-\eta_{outer}\nabla_\theta F(w_\theta,T,\theta) (4)$
上述两个过程一般会进行多次迭代，具体在不同的应用中可以设置不同的循环停止条件，例如根据early stopping，或者根据训练误差和验证误差的关系

4.参考资料

机器学习中的双层规划问题

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

（DDPG）深度学习神经网络算法DDPG优化解决二维栅格地图路径规划研究（Matlab代码实现）

二维栅格地图路径规划是机器人导航、游戏智能体控制等领域的核心问题。传统路径规划算法在处理复杂动态环境时存在局限性，而深度强化学习为解决该问题提供了新思路。本文提出基于深度确定性策略梯度（DDPG）算法的路径规划方法，通过构建Actor-Critic神经网络架构，结合经验回放和目标网络技术，在连续动作空间中实现高效路径搜索。实验结果表明，该方法在复杂栅格环境中展现出更强的环境适应性和路径优化能力，相