视觉SLAM中Bundle Adjustment（BA）问题

重投影误差：对于第iii个相机位姿（参数化为李代数ξi∈se3ξi∈se3）和第jjj个三维点Xj∈R3Xj∈R3，其投影到图像的观测像素坐标为uijuij。pijπexp⁡ξi∧Xjpijπexpξi∧Xj其中π⋅\pi(\cdot)π⋅eijuij−pijeijuij−pij目标函数：min⁡ξ。

徐行tag

1077人浏览 · 2025-03-03 17:18:58

徐行tag · 2025-03-03 17:18:58 发布

引用

视觉SLAM中Bundle Adjustment（BA）问题旨在同时优化相机位姿和三维地图点，以最小化重投影误差。与之前文章中提到的最小化重投影的区别是：BA同时优化相机位姿和三维空间点，并且最小化k时刻之前所有数据的重投影误差；而视觉里程计中的方法仅优化空间点，且只有两帧之间的数据。

详细推导过程：

1. 问题定义与目标函数

重投影误差：
对于第 $i$ 个相机位姿（参数化为李代数 $ξi∈se(3)\boldsymbol{\xi}_i \in \mathfrak{se}(3)$ ）和第 $j$ 个三维点 $Xj∈R3\mathbf{X}_j \in \mathbb{R}^3$ ，其投影到图像的观测像素坐标为 $uij\mathbf{u}_{ij}$ 。
投影过程为：
$pij=π(exp⁡(ξi∧)Xj)\mathbf{p}_{ij} = \pi\left( \exp(\boldsymbol{\xi}_i^\wedge) \mathbf{X}_j \right)$
其中 $π(⋅)\pi(\cdot)$ 为针孔相机模型，重投影误差为：
$eij=uij−pij\mathbf{e}_{ij} = \mathbf{u}_{ij} - \mathbf{p}_{ij}$
目标函数：
最小化所有观测的重投影误差平方和：
$min⁡ξi,Xj∑i,j∣∣eij∣∣2\min_{\boldsymbol{\xi}_i, \mathbf{X}_j} \sum_{i,j} ||\mathbf{e}_{ij} ||^2$

2. 非线性优化方法

采用高斯-牛顿法或列文伯格-马夸尔特法进行迭代优化，步骤如下：
2.1 误差函数的线性化
对误差项进行一阶泰勒展开：
$eij(ξi+Δξi,Xj+ΔXj)≈eij+JiposeΔξi+JjpointΔXj\mathbf{e}_{ij}(\boldsymbol{\xi}_i + \Delta\boldsymbol{\xi}_i, \mathbf{X}_j + \Delta\mathbf{X}_j) \approx \mathbf{e}_{ij} + \mathbf{J}_{i}^{\text{pose}} \Delta\boldsymbol{\xi}_i + \mathbf{J}_{j}^{\text{point}} \Delta\mathbf{X}_j$
其中：

$Jipose=∂eij∂ξi\mathbf{J}_{i}^{\text{pose}} = \frac{\partial \mathbf{e}_{ij}}{\partial \boldsymbol{\xi}_i}$ 是误差对相机位姿的雅可比矩阵。
$Jjpoint=∂eij∂Xj\mathbf{J}_{j}^{\text{point}} = \frac{\partial \mathbf{e}_{ij}}{\partial \mathbf{X}_j}$ 是误差对三维点的雅可比矩阵。
2.2 雅可比矩阵计算
相机位姿导数（左扰动模型）：
设 $ξi\boldsymbol{\xi}_i$ 的左扰动为 $Δξ\Delta\boldsymbol{\xi}$
投影点对位姿的导数为：
$Jipose=−∂π∂p⋅∂(TiXj)∂Δξ∣Δξ=0\mathbf{J}_{i}^{\text{pose}} = -\frac{\partial \pi}{\partial \mathbf{p}} \cdot \frac{\partial ( \mathbf{T}_i \mathbf{X}_j)}{\partial \Delta\boldsymbol{\xi}} \bigg|_{\Delta\boldsymbol{\xi}=0}$
其中 $∂π∂p\frac{\partial \pi}{\partial \mathbf{p}}$ 为投影函数对三维点的导数，与直接法类似；
$∂(TiXj)∂ξi=[I3×3,−(TiXJ)∧]\frac{\partial (\mathbf{T}_i \mathbf{X}_j)}{\partial \boldsymbol{\xi}_i}=[I_{3\times3, -(\mathbf{T}_i\mathbf{X}_J)^\wedge}]$ 在直接法等文章中已经推导过。
三维点导数：
$Jjpoint=−∂π∂p⋅Ri\mathbf{J}_{j}^{\text{point}} = -\frac{\partial \pi}{\partial \mathbf{p}} \cdot \mathbf{R}_i$
其中 $Ri\mathbf{R}_i$ 为相机的旋转矩阵。

3. 构建增量方程

将优化变量组合为
$Δx={Δξ1,…,Δξm,ΔX1,…,ΔXn}T\Delta\mathbf{x} = \{ \Delta\boldsymbol{\xi}_1, \dots, \Delta\boldsymbol{\xi}_m, \Delta\mathbf{X}_1, \dots, \Delta\mathbf{X}_n \}^T$
目标函数变为：
$∑i,j∣∣eij+JijΔx∣∣2\sum_{i,j} || \mathbf{e}_{ij} + \mathbf{J}_{ij} \Delta\mathbf{x} ||^2$
其中 $Jij\mathbf{J}_{ij}$ 为对应误差项的雅可比块。
整体增量方程为： $JTJΔx=−JTe\mathbf{J}^T \mathbf{J} \Delta\mathbf{x} = -\mathbf{J}^T \mathbf{e}$
其中 $J\mathbf{J}$ 为稀疏雅可比矩阵， $e\mathbf{e}$ 为所有误差项堆叠的向量。

4. 利用稀疏性加速求解

由于每个误差项仅关联一个相机和一个点， $JTJ\mathbf{J}^T \mathbf{J}$ 具有分块对角结构，可分解为：
$H=[HccHcpHpcHpp]\mathbf{H} = \begin{bmatrix}\mathbf{H}_{\text{cc}} & \mathbf{H}_{\text{cp}} \\\mathbf{H}_{\text{pc}} & \mathbf{H}_{\text{pp}}\end{bmatrix}$
代入增量方程得到方程组：
$\begin{cases} \mathbf{H}_{cc} \Delta \xi + \mathbf{H}_{cp} \Delta P = -\mathbf{b}_c \\ \mathbf{H}_{pc} \Delta \xi + \mathbf{H}_{pp} \Delta P = -\mathbf{b}_p \end{cases}$
通过舒尔补（Schur Complement）消去三维点变量 $ΔP\Delta P$ ：
$(Hcc−HcpHpp−1Hpc)Δξ=bc−HcpHpp−1bp\left( \mathbf{H}_{\text{cc}} - \mathbf{H}_{\text{cp}} \mathbf{H}_{\text{pp}}^{-1} \mathbf{H}_{\text{pc}} \right) \Delta\boldsymbol{\xi} = \mathbf{b}_{\text{c}} - \mathbf{H}_{\text{cp}} \mathbf{H}_{\text{pp}}^{-1} \mathbf{b}_{\text{p}}$
求解后回代得到点变量的增量：
$ΔP=Hpp−1(bp−HpcΔξ)\Delta\mathbf{P} = \mathbf{H}_{\text{pp}}^{-1} \left( \mathbf{b}_{\text{p}} - \mathbf{H}_{\text{pc}} \Delta\boldsymbol{\xi} \right)$
这一步将计算复杂度从 $O(n^3)$ 降低到 $O(m^3 + n)$ ,( $m$ 为相机数量， $n$ 为地图点数量）

5. 迭代更新与收敛

重复以下步骤直至收敛：

线性化误差：计算雅可比矩阵和残差。
构建并求解增量方程：利用稀疏求解器（如Cholesky分解）高效计算。
更新变量：
$ξi←ξi+Δξi,Xj←Xj+ΔXj\boldsymbol{\xi}_i \leftarrow \boldsymbol{\xi}_i + \Delta\boldsymbol{\xi}_i, \quad \mathbf{X}_j \leftarrow \mathbf{X}_j + \Delta\mathbf{X}_j$