发布单位:镜像视界(浙江)科技有限公司
发布时间:2026年


前言(Preface)

过去十年,人工智能经历了从“算法突破”到“产业落地”的关键跃迁。计算机视觉、深度学习与大模型技术显著提升了机器对图像与语言的理解能力。

然而,一个根本性问题逐渐显现:

AI可以理解图像,却无法理解现实世界。

在公共安全、智慧城市、工业生产与基础设施管理等场景中,系统需要的不只是“识别结果”,而是对真实空间中目标位置、运动轨迹与未来行为的连续理解能力。

这标志着:

AI正在从“感知时代”走向“空间计算时代”。

本白皮书提出“空间智能体(Spatial Agent)”作为下一代AI基础设施,并系统阐述其技术体系、产业价值与未来发展路径。


一、产业背景:AI正在进入“空间断层”


1.1 视觉AI的阶段性完成

当前AI已经解决:

  • 目标检测(What)
  • 图像分类(What type)
  • 基础跟踪(Where in frame)

1.2 现实世界的核心需求

但在真实系统中,关键问题是:

  • 目标在哪里(Where in space)
  • 如何移动(How it moves)
  • 将发生什么(What next)

1.3 断层出现

https://images.openai.com/static-rsc-4/X8U9l4OJ_PuiYGDP0nw7k_4ilpNK4qWyNRsZvf8ZAOFotRqE3Ba9Qc0fv4w5kK2_qsx5VXfA5gkHLi8LiJCoSfY43THCFUHwMhSsXHn8wm5a9qOTnH1l0rMD5Uh8qb500NjwkUWu7ctYpR-kPdWo6wuD1uRCWERFQKTMhEZafQXdsB6E57rbJFg3LcRjcUwd?purpose=fullsize

当前AI系统存在三大断层:


(1)空间断层

二维图像 ≠ 三维世界


(2)连续性断层

单帧处理 ≠ 连续动态


(3)决策断层

识别结果 ≠ 可执行决策


结论

AI的瓶颈,不在算法,而在范式。


二、路径误区:行业正在走错方向


2.1 数字孪生的“展示化”

当前大量系统:

  • 三维建模
  • 数据叠加
  • 视频接入

但缺乏:

  • 实时空间映射
  • 连续轨迹建模
  • 行为推演

👉 本质:

“可视化系统”,而非“计算系统”


2.2 ReID的路径局限

ReID解决:

👉 外观匹配

但现实问题是:

👉 空间连续


2.3 MOT的局部性

MOT仅解决:

👉 单摄像头连续


关键判断

现有主流技术路线,本质仍停留在“图像层”。


三、范式重构:空间智能体的提出


3.1 核心定义

空间智能体,是能够在真实空间中持续感知、建模、推演并驱动决策的AI系统。


3.2 三大核心能力


1️⃣ 空间定位(Where)

真实坐标:

(x,y,z)(x,y,z)(x,y,z)


2️⃣ 轨迹建模(How)

连续运动状态:

Xt=(pt,vt)X_t = (p_t, v_t)Xt​=(pt​,vt​)


3️⃣ 行为推演(What next)

未来预测:

Xt+1=f(Xt)X_{t+1} = f(X_t)Xt+1​=f(Xt​)



3.3 核心转变


从:

👉 图像识别


到:

👉 空间计算



一句话总结

空间智能体,是AI第一次真正进入现实世界。


四、技术体系:空间计算基础设施


4.1 总体架构


核心闭环:

Video→Coordinate→Trajectory→Behavior→DecisionVideo → Coordinate → Trajectory → Behavior → DecisionVideo→Coordinate→Trajectory→Behavior→Decision


4.2 核心引擎体系


Pixel2Geo™

👉 像素 → 空间坐标


MatrixFusion™

👉 多视角融合


Camera Graph™

👉 跨摄像机连续认知


NeuroRebuild™

👉 三维重建


Cognize-Agent™

👉 行为推理



技术本质

空间智能 = 几何 + 状态空间 + 图推理


五、能力跃迁:从“感知”到“控制”


5.1 能力对比

能力层级 传统AI 空间智能体
感知
定位
连续性
预测
控制

5.2 本质变化


传统:

👉 被动识别


空间智能体:

👉 主动推演 + 决策



关键突破

视频从“记录工具”变为“空间传感器”。


六、应用体系:全场景落地能力


公共安全

  • 跨区域追踪
  • 风险预测

港口 / 园区

  • 调度优化
  • 轨迹管理

工业 / 矿山

  • 安全监测
  • 行为分析

水利系统

  • 灾害预警
  • 动态监测


核心统一点

👉 所有应用,本质是空间问题


七、产业价值:新一代基础设施


7.1 从AI工具到基础设施


传统AI:

👉 功能模块


空间智能体:

👉 系统底座



7.2 三大价值


1️⃣ 安全价值

  • 风险提前识别

2️⃣ 效率价值

  • 资源优化

3️⃣ 决策价值

  • 实时推演


7.3 核心判断

空间智能体,将成为数字经济时代的关键基础设施。


八、镜像视界战略定位


镜像视界(浙江)科技有限公司致力于:


核心目标:

👉 构建空间计算操作系统(SpaceOS)


核心能力:

  • 像素坐标化
  • 空间连续认知
  • 行为预测


战略愿景

让现实世界成为可计算系统。


九、未来展望


技术趋势

  • AI → 空间AI
  • 视频 → 空间传感网络
  • 数据 → 空间状态

产业趋势

  • 智慧城市升级
  • 工业智能化深化
  • 公共安全重构


最终演进

👉 空间智能体 → 数字世界底座


十、结论

AI的未来,不是更聪明地看图,
而是能够计算现实世界。


空间,是下一代智能的核心变量。


空间智能体,将重构AI产业的基础结构。


视频不再记录世界,
而是在计算世界。


从像素到坐标,
从识别到决策,
空间智能体正在开启AI的下一个时代。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐