位姿估计和坐标系变换

在SLAM中，所谓的位姿其实指的是相机在世界坐标系中的位姿。位姿包括两方面：位置和姿势，即三维坐标和朝向。如下所示，建图的过程就需要知道每一刻相机的位姿，从而将当前相机捕获的点云注册到全局的点云模型中。常用的变换有：世界坐标系 -> 相机坐标系和相机的位姿 -> 世界坐标系如下所示：世界坐标系为wxywxywxy, 相机坐标系为cx’y’cx^’y^’cx’y’， PPP...

Researcher-Du

5571人浏览 · 2019-11-13 10:35:58

Researcher-Du · 2019-11-13 10:35:58 发布

SLAM是一个“鸡生蛋和蛋生鸡”的问题，要定位需要重建，一般通过当前sensor看到到场景跟建好的地图进行匹配确定自身的位置。简单的例子：比如你在平面上，别人问你的坐标，那么很显然你得先有坐标系。要重建又需要精确的定位信息，如果没有相机位姿，那么当前帧数据无法统一注册到世界坐标系下。

在SLAM中，所谓的位姿其实指的是相机在世界坐标系中的位姿。位姿包括两方面：位置和姿势，即三维坐标和朝向。如下所示，建图的过程就需要知道每一刻相机的位姿，从而将当前相机捕获的点云注册到全局的点云模型中。
在这里插入图片描述
常用的变换有：世界坐标系 -> 相机坐标系 和 相机的位姿 -> 世界坐标系
如下所示：世界坐标系为 $w x y$ , 相机坐标系为 $cx^’y^’$ ， $P$ 在世界坐标下的坐标为 $(a, b)$ , $P$ 在相机坐标系下的坐标为 $a^’b^’)$ 。

(1) 已知相机坐标系在世界坐标系的位姿为： $T_{cw}$ , 世界坐标中的点 $P_w$ , 那么相机坐标系的坐标为 $Pc=Tcw−1PwP_c = T^{-1}_{cw}P_w$
(2) 已知相机坐标系在世界坐标系的位姿为： $T_{cw}$ , 相机坐标中的点 $P_c$ , 那么世界坐标系的坐标为 $P_w = T_{cw}P_c$

$T_{cw}$ 和 $Tcw−1T^{-1}_{cw}$ 均可作为相机位姿，主流的如ORBSLAM采用后者作为相机的位姿。
在这里插入图片描述
可以检验一下：
(1）只包含平移，相机坐标系在世界坐标下只有平移，平移向量为 $(2, 2)$ ，那么 $Tcw=[102012001]T_{cw} = \begin{bmatrix} 1 & 0 & 2\\ 0 & 1 & 2\\ 0 & 0 & 1 \end{bmatrix}$ ， $Tcw−1=[10−201−2001]T^{-1}_{cw} = \begin{bmatrix} 1 & 0 & -2\\ 0 & 1 & -2\\ 0 & 0 & 1 \end{bmatrix}$
已知世界坐标系中的坐标为 $P_w(3,3)$ , 转换到相机坐标系下为： $Pc=Tcw−1Pw=[10−201−2001]∗[331]=[111]P_c = T^{-1}_{cw} P_w = \begin{bmatrix} 1 & 0 & -2\\ 0 & 1 & -2\\ 0 & 0 & 1 \end{bmatrix} * \begin{bmatrix} 3 \\ 3 \\ 1 \end{bmatrix} = \begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix}$ 。因此，相机坐标系下的坐标 $P_c = (1,1)$
反之，已知相机坐标系下的坐标 $P_c(1,1)$ , 转换到世界坐标系下为： $Pw=TcwPc=[102012001]∗[111]=[331]P_w = T_{cw} P_c = \begin{bmatrix} 1 & 0 & 2\\ 0 & 1 & 2\\ 0 & 0 & 1 \end{bmatrix} * \begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix} = \begin{bmatrix} 3 \\ 3 \\ 1 \end{bmatrix}$ , 因此，世界坐标系下的坐标 $P_w = (3,3)$
在这里插入图片描述
(2)只包含旋转，相机坐标系在世界坐标系中逆时针旋转了 $180°180\degree$ , 那么位姿矩阵 $Tcw=[−1000−10001]T_{cw} = \begin{bmatrix} -1 & 0 & 0\\ 0 & -1 & 0\\ 0 & 0 & 1 \end{bmatrix}$ , $Tcw−1=[−1000−10001]T^{-1}_{cw} = \begin{bmatrix} -1 & 0 & 0\\ 0 & -1 & 0\\ 0 & 0 & 1 \end{bmatrix}$ ,

已知世界坐标系中的坐标为 $P_w(3,3)$ , 转换到相机坐标系下为 $Pc=Tcw−1Pw=(−3,−3)P_c = T^{-1}_{cw} P_w = (-3,-3)$
反之，相机坐标下的坐标为 $P_c(-3,-3)$ , 转换到世界坐标系下为 $P_w = T_{cw}P_c = (3,3)$

(3)既包含旋转又包含平移，先逆时针旋转 $180°180\degree$ ，然后平移 $(2, 2)$ , 因此 $Tcw=[0−12102001]T_{cw} = \begin{bmatrix} 0 & -1 & 2\\ 1 & 0 & 2\\ 0 & 0 & 1 \end{bmatrix}$ , $Tcw−1=[01−2−102001]T^{-1}_{cw} = \begin{bmatrix} 0 & 1 & -2\\ -1 & 0 & 2\\ 0 & 0 & 1 \end{bmatrix}$ ,
已知世界坐标系中的坐标为 $P_w(2,2)$ , 转换到相机坐标系下为 $Pc=Tcw−1Pw=(0,0)P_c =T^{-1}_{cw} P_w = (0,0)$
已知世界坐标系中的坐标为 $P_w(3,3)$ , 转换到相机坐标系下为 $Pc=Tcw−1Pw=(1,−1)P_c =T^{-1}_{cw} P_w = (1,-1)$
反之，已知相机坐标系中的坐标为 $P_c(0,0)$ , 转换到相机坐标系下为 $P_w =T_{cw} P_c = (2,2)$

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

前端 + agent 开发学习路线

Agent = 大模型API + Prompt优化Agent = 系统架构 + 可控执行 + 安全审查 + 领域适配 + 可观测性作为前端开发者，你在Agent时代拥有独特优势用户体验敏感：知道如何设计自然的AI交互状态管理专家：能设计复杂的Agent工作流快速迭代能力：前端开发的敏捷性能快速验证想法可视化能力：能让黑盒的AI决策变得透明不要被"AI需要Python"的说法限制，Node.js生态

2048 AI社区

【癌症诊断】基于粒子群算法PSO优化人工神经网络ANN癌症诊断附Matlab代码

一、癌症诊断的痛点：传统方法与 AI 技术的 “双向奔赴”癌症诊断的核心诉求是早期发现、精准分型，但传统诊断方式（如病理活检、影像学分析）存在明显局限：病理活检依赖医生经验，主观性强且耗时；影像学检查对微小病灶的识别率不足，易出现漏诊、误诊。而人工神经网络（ANN）作为 AI 领域的经典模型，具备强大的特征提取与模式识别能力，可通过学习海量医疗数据（如基因表达数据、病理图像特征、血液指标）自动构建