MPC学习笔记(一)：手推MPC公式

1.MPC四要素(1)模型:采用阶跃响应(2)预测(3)滚动优化:二次规划J(x)=x2+bx+cJ\left(x\right)=x^2+bx+cJ(x)=x2+bx+c极值点J′(x0)=0J^\prime\left(x_0\right)=0J′(x0)=0(4)误差补偿参数定义P:预测步长y(k+1),y(k+2)…y(k+P)y\left(k+1\right),y\left(k+2\rig

煜个头头

11809人浏览 · 2021-10-17 22:47:32

煜个头头 · 2021-10-17 22:47:32 发布

1.介绍

MPC(Model Predictive Control)，即模型预测控制，是一种进阶的过程控制方法。相比于LQR和PID算法只能考虑输入输出变量的各种约束，MPC算法可以考虑状态空间变量的约束。可以应用于线性和非线性的系统中。
参考资料：

2.MPC四要素

(1) 模型:采用阶跃响应

(2) 预测

(3) 滚动优化:

二次规划
$J\left(x\right)=x^2+bx+c$
极值点
$J^\prime\left(x_0\right)=0$
(4) 误差补偿

参数定义

P:预测步长
$y\left(k+1\right),y\left(k+2\right)\ldots y(k+P)$
M:控制步长
$\ ∆u(k),∆u(k+1)…∆u(k+M)$

3.推导过程

(1)模型

假定在T,2T…PT时刻模型对应的输出为
$a_1,a_2\ldots a_p$
则根据线性系统的叠加原理:
$y\left(k\right)=a_1\ast u\left(k-1\right)+a_2\ast u\left(k-2\right)+a_M\ast u(k-M)$

增量式:
$∆y\left(k\right)=a_1\ast ∆u\left(k-1\right)+a_2\ast ∆u\left(k-2\right)+a_M\ast ∆u(k-M)$

(2)预测:共预测P个时刻

$∆y(k+1)=a_1\ast∆u(k)$

$y(k+2)=a_1*∆u(k)+1+a_2*∆u(k)$

$y(k+P)=a_1*∆u(k+P-1)+a_2*∆u(k+P-2)…+a_M*∆u(k+P-M)$

转为矩阵表示:
$\sum_{i=1}^{M}{a_i\ast}∆u(k+P-i)$

新的预测输出 = 原预测输出 + 增量输入
${\hat{Y}}_0=A\ast∆u+Y_0 \\ \left[\begin{matrix}\begin{matrix}{\hat{Y}}_0(k+1)\\{\hat{Y}}_0(k+2)\\\end{matrix}\\\begin{matrix}\vdots\\{\hat{Y}}_0(k+P)\\\end{matrix}\\\end{matrix}\right]=\left[\begin{matrix}\begin{matrix}a_1&0\\a_2&a_1\\\end{matrix}&\begin{matrix}\cdots&0\\\cdots&0\\\end{matrix}\\\begin{matrix}\vdots&\vdots\\a_P&a_{P-1}\\\end{matrix}&\begin{matrix}\ddots&\vdots\\\cdots&a_{P-M+1}\\\end{matrix}\\\end{matrix}\right] \left[\begin{matrix}\begin{matrix}∆u(k)\\∆u(k+1)\\\end{matrix}\\\begin{matrix}\vdots\\∆u(k+M)\\\end{matrix}\\\end{matrix}\right]+\left[\begin{matrix}\begin{matrix}Y_0(k+1)\\Y_0(k+2)\\\end{matrix}\\\begin{matrix}\vdots\\Y_0(k+P)\\\end{matrix}\\\end{matrix}\right]$

(3)滚动优化

注：求解出来的∆u为M*1的向量，取第一个，即 $u_0$ 作为输入的增量。

参考轨迹
使用一阶滤波处理:
$\omega\left(k+i\right)=\alpha^iy\left(k\right)+(1-\alpha^i)y_r(k)$
代价函数（与最优化控制相似）
形式一

目标一：离目标越近越好
$J_1=\sum_{i=1}^{P}\left[y\left(k+i\right)-\omega\left(k+i\right)\right]^2$

目标二：能量消耗越小越好
$J_2=i=\sum_{i=1}^{M}[∆u(k+i-1)]^2$

合体得到总的代价函数
$J=qJ_1+rJ_2$

q和r都是权重系数，它们的相对大小表示更看重哪个指标，越大说明越看重。

矩阵形式：
$J=\left(r-\omega\right)^TQ\left(R-\omega\right)+∆u^TR∆u\\$
其中，Q和R大多数为对角阵（一般不考虑协方差矩阵，即不同变量之间相互影响的情况）
$\begin{bmatrix} q_1& 0 & ... & 0\\ 0& q_2 & ...& 0\\ \vdots & \vdots &\ddots &\vdots \\ 0&0 & 0&q_n \end{bmatrix} \begin{bmatrix} r_1& 0 & ... & 0\\ 0& r_2 & ...& 0\\ \vdots & \vdots &\ddots &\vdots \\ 0&0 & 0&r_n \end{bmatrix}$
最优解：
$\frac{\partial \mathrm{J}(\Delta u)}{\partial(\Delta u)}=0 \rightarrow \Delta u=\left(\mathrm{A}^{\mathrm{T}} \mathrm{QA}+\mathrm{R}\right)^{-1} \mathrm{~A}^{\mathrm{T}}\left(\omega-\mathrm{Y}_{0}\right)$
形式二
- 基于 $u_k,u_{k+1}...u_{k+N-1}进行最优化$
  $\sum_k^{N-1}(E_k^TQE_k + u_k^TRu_k)+\underbrace{E_N^TFE_N} _{terminal \ predict \ status}$

(4)反馈校正，误差补偿

k时刻，预测P个输出：
${\hat{Y}}_0\left(k+1\right)，{\hat{Y}}_0\left(k+2\right)...{\hat{Y}}_0\left(k+P\right)$
k+1时刻，当前输出为：
$y (k + 1)$
误差：
$e\left(k+1\right)=\ y\left(k+1\right)-{\hat{Y}}_0\left(k+1\right)$

h:补偿系数，取值范围0-1，习惯0.5

补偿：
${y}_{cor}\left(k+1\right)=\ {\hat{Y}}_0\left(k+1\right)+h_1\ast e\left(k+1\right) \\y_{cor}\left(k+2\right)=\ {\hat{Y}}_0\left(k+2\right)+h_2\ast e\left(k+1\right) \\\vdots \\y_{cor}\left(k+P\right)=\ {\hat{Y}}_0\left(k+P\right)+h_P\ast e\left(k+1\right)$
矩阵表示：
$Y_{cor}={\hat{Y}}_0+H\ast e(k+1)$

滚动更新预测输出：

K+1时刻：
${\hat{Y}}_0=S\ast Y_{cor}$

S:移位矩阵(PxP)
$\left[\begin{matrix}\begin{matrix}0&1\\0&0\\\end{matrix}&\begin{matrix}\cdots&0\\\cdots&\vdots\\\end{matrix}\\\begin{matrix}\vdots&\vdots\\0&0\\\end{matrix}&\begin{matrix}\ddots&1\\\cdots&1\\\end{matrix}\\\end{matrix}\right]$

补充:代价函数的推导

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

金融科技：利用AI风控模型重构信贷审批流程

2048 AI社区

CVPR 2026 | 中科院提出LTS-FS：精准打击LVLM幻觉，层级稀疏引导让模型更清醒

2048 AI社区

金融行业 Multi-Agent 落地实践：智能投顾与风险监控的协同架构设计

凌晨2点，纽约曼哈顿下城，高盛大厦的交易大厅依旧灯火通明。交易员Alex盯着屏幕上闪烁的数字，额头上渗出细密的汗珠——市场正在经历一场罕见的"闪电崩盘"，而他负责的投资组合正面临巨大风险。"AI系统怎么还没反应？"Alex对着电话怒吼。电话那头，数据科学家Sarah正在 frantically 调试系统：“我们的风险监控模型发现了异常，但智能投顾系统还在按照原定策略执行交易……两个系统’吵架’了！