【卡尔曼滤波理论推导与实践】【理论】【3.1/5 卡尔曼增益01】

上节，推导得到了状态空间方程，可以得到系统模型值了。目前核心思想中的【修正】这个概念还处于迷雾中，本节对此进行推导。往下看之前，如果让你来原创，你会怎么用表达式将【测量值修正系统模型值】这句话的逻辑清晰地写出来？有差值才有【修正】，而差值是测量值和系统模型之间的差，是在被修正值的基础上加这个差值，因此这是一个关于测量值和系统模型值的逻辑。【修正】的逻辑应当是这样的：将测量值与模型值的差作为修正值，

朴人

1518人浏览 · 2024-12-22 15:18:47

朴人 · 2024-12-22 15:18:47 发布

上节，推导得到了状态空间方程，可以得到系统模型值了。目前核心思想中的【修正】这个概念还处于迷雾中，本节对此进行推导。
往下看之前，如果让你来原创，你会怎么用表达式将【测量值修正系统模型值】这句话的逻辑清晰地写出来？

修正

有差值才有【修正】，而差值是测量值和系统模型之间的差，是在被修正值的基础上加这个差值，因此这是一个关于测量值和系统模型值的逻辑。【修正】的逻辑应当是这样的：将测量值与模型值的差作为修正值，乘个系数后，叠加到模型值，这就是卡尔曼滤波的【修正】。这个系数，被称为卡尔曼增益。由于 $\vec{z_k}$ 是一个向量，因此这个系数是矩阵形式，将其记作 $\mathrm{G}$ ，将每轮次的卡尔曼增益记作 $\mathrm{G_k}$ ，很明显这是一个对角矩阵。将这个逻辑写做数学表达式：
$\begin{aligned}\vec{z_{k估}}&=\vec{z_{k模}}+\mathrm{G_k}*(\vec{z_{k测}}-\vec{z_{k模}})\end{aligned}$
观察上式，等式右边的 $\vec{z_{k模}}$ 在上节的状态空间方程里推导得到了， $\vec{z_{k测}}$ 也可以根据上节的测量方程 $\vec{y_{k测}}=\mathrm{H}*\vec{z_{k测}}$ 得到，只有卡尔曼增益 $\mathrm{G_k}$ 还不知道，我们要找到最佳的 $\mathrm{G_k}$ 使得 $\vec{z_{k估}}$ 最接近 $\vec{z_{k真}}$ 。接下来对 $\mathrm{G_k}$ 进行推导，推导完毕后，卡尔曼滤波就整个都可知了。

最优估计

卡尔曼滤波思想中要的是最优估计 $\vec{z_{k估}}$ ，即估计值与真值的差值越接近零越好，当然真值的数值是无法知道的，但是我们上节建立了真值的数学模型。估计值与真值的差距记作 $\vec{e_{k估}}$ ，可以用如下公式来表达：
$\vec{e_{k估}}=\vec{z_{k真}}-\vec{z_{k估}}$
$\vec{e_{k估}}$ 是一个向量，也就是说让这个向量的长度最小，即平方和最小。然而，真值里的噪声只是假定为正态分布，每轮次的具体数值是不可知的，因此直接用平方和最小的方法不可行。
还有另一种方法有着与平方和一样的表达式，那就是协方差矩阵的迹，协方差矩阵解决了噪声的数值问题，因为正态分布的协方差矩阵是可知的。于是，记 $\vec{e_{k估}}$ 的协方差为 $\mathrm{P_{k估}}$ ，求 $\mathrm{G_k}$ 使得 $\vec{e_{k估}}$ 接近零的问题转为求 $\mathrm{G_k}$ 使得 $tr(\mathrm{P_{k估}})$ 最小的问题。
$tr(\mathrm{P_{k估}})$ 表达式与平方和一样，是一个开口向上的二次方程，因此极值点必定是最小值点， $\frac{d tr(\mathrm{P_{k估}})}{d\mathrm{G_k}}=0$ 时的 $(\mathrm{P_{k估}},\mathrm{G_k})$ 就是最优估计 $\vec{z_{k估}}$ 要用到的值。

卡尔曼增益

$\mathrm{P_{k估}}$ 还不知道，先把它搞出来再算卡尔曼增益 $\mathrm{G_k}$ 。
根据协方差定义的公式，
$\begin{aligned}\mathrm{P_{k估}}&=E[\vec{e_{k估}}*\vec{e_{k估}}^T]\\ &=E[(\vec{z_{k真}}-\vec{z_{k估}})*(\vec{z_{k真}}-\vec{z_{k估}})^T]\end{aligned}$

展开一下 $(\vec{z_{k真}}-\vec{z_{k估}})$ ，注意一下对测量值的处理：
$\begin{aligned}\vec{z_{k真}}-\vec{z_{k估}}&=\vec{z_{k真}}-(\vec{z_{k模}}+\mathrm{G_k}*(\mathrm{H}^{-1}*y_{k测}-\vec{z_{k模}}))\\&=\vec{z_{k真}}-(\vec{z_{k模}}+\mathrm{G_k}*(\mathrm{H}^{-1}*(\mathrm{H}*\vec{z_{k真}}+\vec{v_k})-\vec{z_{k模}}))\\&=\vec{z_{k真}}-\vec{z_{k模}}-\mathrm{G_k}*\vec{z_{k真}}+\mathrm{G_k}*\vec{z_{k模}}-\mathrm{G_k}*\mathrm{H}^{-1}*\vec{v_k}\end{aligned}$ 发现可以合并化简，因为 $\vec{z_{k真}}-\vec{z_{k模}}=\vec{e_{k模}}$ ，所以继续化简为：
$\vec{z_{k真}}-\vec{z_{k估}}=(\mathrm{I}-\mathrm{G_k})\vec{e_{k模}}-\mathrm{G_k}*\mathrm{H}^{-1}*\vec{v_k}$

$\mathrm{P_{k估}}$ 可以继续展开了：
$\begin{aligned}\mathrm{P_{k估}}&=E[((\mathrm{I}-\mathrm{G_k})\vec{e_{k模}}-\mathrm{G_k}*\mathrm{H}^{-1}*\vec{v_k})*((\mathrm{I}-\mathrm{G_k})\vec{e_{k模}}-\mathrm{G_k}*\mathrm{H}^{-1}*\vec{v_k})^T]\end{aligned}$
将转置操作分配到括号里：

$\begin{aligned}\mathrm{P_{k估}}&=E[((\mathrm{I}-\mathrm{G_k})\vec{e_{k模}}-\mathrm{G_k}\mathrm{H}^{-1}\vec{v_k})(\vec{e_{k模}}^T(\mathrm{I}-\mathrm{G_k})^T-\vec{v_k}^T(\mathrm{G_k}\mathrm{H}^{-1})^T)]\end{aligned}$
接下来将括号乘开。这里有两点有助于化简：噪声 $\vec{v_k}$ 的期望是零，又与 $\vec{e_{k模}}$ 相互独立，所以 $\vec{v_k}$ 和 $\vec{e_{k模}}$ 搭边的项都是零； $\mathrm{I},\mathrm{G_k},\mathrm{H}$ 是对角矩阵，转置等于本身，而且左乘右乘没区别。乘开后可以得到以下结果：
$\begin{aligned}\mathrm{P_{k估}}&=E[(\mathrm{I}-\mathrm{G_k})^2\vec{e_{k模}}\vec{e_{k模}}^T+\mathrm{G_k}^2(\mathrm{H}^{-1})^2\vec{v_k}\vec{v_k}^T]\end{aligned}$
再把期望分配到括号里：
$\begin{aligned}\mathrm{P_{k估}}&=(\mathrm{I}-\mathrm{G_k})^2E[\vec{e_{k模}}\vec{e_{k模}}^T]+\mathrm{G_k}^2(\mathrm{H}^{-1})^2E[\vec{v_k}\vec{v_k}^T]\end{aligned}$
$E[\vec{e_{k模}}\vec{e_{k模}}^T]$ 是一个协方差矩阵，这里记作 $\mathrm{P_{k模}}$ ，这个协方差矩阵的值现在还未知。 $E[\vec{v_k}\vec{v_k}^T]$ 是一个测量噪声的协方差矩阵，是人为假定的常数，是已知的，记做 $\mathrm{R}$ 。再化简为：
$\begin{aligned}\mathrm{P_{k估}}&=(\mathrm{I}-\mathrm{G_k})^2\mathrm{P_{k模}}+\mathrm{G_k}^2(\mathrm{H}^{-1})^2\mathrm{R}\end{aligned}$
接下来就可以求 $tr(\mathrm{P_{k估}})$ 关于 $\mathrm{G_k}$ 的导数，从而算出极值点了。这里用到了链式求导法则和矩阵求导： $\frac{dtr(\mathrm{A}\mathrm{B})}{d\mathrm{A}}=\mathrm{B}^T$ 。注意两点：协方差矩阵是斜对角对称矩阵，其转置等于本身；对角阵左乘和右乘是一样的。计算 $tr(\mathrm{P_{k估}})$ 的极值点：
$\frac{dtr(\mathrm{P_{k估}})}{d\mathrm{G_k}}=-2(\mathrm{I}-\mathrm{G_k})\mathrm{P_{k模}}+2\mathrm{G_k}(\mathrm{H}^{-1})^2\mathrm{R}=0$
得出卡尔曼增益 $\mathrm{G_k}$ 等于：
$\mathrm{G_k}=\frac{\mathrm{P_{k模}}}{\mathrm{P_{k模}}+(\mathrm{H}^{-1})^2\mathrm{R}}$

注意 $\mathrm{P_{k模}}$ 现在还没推导出来，在下节进行推导。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

必看！未来AI智能体的发展方向，架构师如何应对技术瓶颈？

AI智能体正从任务导向的工具向自主协作的伙伴进化，其核心驱动力是人类对“通用智能”的追求。泛化能力弱（依赖特定数据）、因果推理缺失（停留在关联分析）、系统复杂度失控（模块协同困难）。本文从第一性原理出发，拆解智能体的本质需求（适应环境+实现目标），构建“感知-推理-行动-学习”的闭环架构，并结合神经符号混合范式具身学习伦理安全设计等前沿技术，为架构师提供突破瓶颈的系统方案。

2048 AI社区

【2025最新】基于SpringBoot+微信小程序的微信书院预约系统管理系统源码+MyBatis+MySQL

2048 AI社区

《AI应用架构师在企业AI应用商店建设中的关键作用》

企业AI应用商店（Enterprise AI App Store）就是这样一个“橱柜”——它是企业内部的AI能力共享平台，将分散的AI模型、工具、解决方案封装成“可搜索、可配置、可复用”的应用，让业务用户（比如销售、运营、财务）无需懂代码就能快速调用AI能力，同时让技术团队（算法、IT）避免重复开发。举个直观的例子：某制造企业的AI应用商店里有一个“设备故障预测”应用，车间工人只需要在界面上选择“