在自动驾驶(Autonomous Driving)领域,过去十年(2015–2025)是一场从**“基于规则的辅助驾驶”“基于大模型的端到端自动驾驶”**的范式革命。

这十年中,汽车从“纯机械工具”彻底进化为“移动的计算终端”。以下是智驾演进的四大核心阶段:


一、 算法架构:从“代码堆砌”到“原生 AI”

智驾的“大脑”架构经历了从人工拆解到深度集成的质变。

  • 2015–2020(模块化与规则驱动时代): 将驾驶拆分为感知、预测、规划、控制四个独立模块。每一层都由工程师编写数万行 if-else 逻辑。

  • 痛点: 无法穷尽现实世界的极端场景(Corner Cases),模块间的“信息损耗”严重,导致系统在复杂路口频频接管。

  • 2021–2023(BEV + Transformer 时代): 引入 BEV(鸟瞰图) 架构。通过 Transformer 将多个摄像头的 2D 图像实时融合成统一的 3D 空间。

  • 突破: 解决了跨摄像头目标追踪难题,感知能力实现质变。

  • 2024–2025(端到端大模型时代): 模仿人类直觉的 VLA(视觉-语言-动作) 架构成为主流。传感器数据直接输入神经网络,直接输出驾驶轨迹。

  • 现状: 智驾系统具备了“老司机”的防御性驾驶常识,面对修路、无标线等场景不再频频“跳出”。


二、 感知进化:从“依赖地图”到“感知即地图”

感知系统决定了智驾的“视力”范围。

  • 2015–2021(强图时代): 早期智驾高度依赖高精地图(HD Map)。车辆像是在预设的“虚拟轨道”上行驶,一旦修路或地图更新不及时,系统就会失效。
  • 2022–2025(无图与占用网络时代): 随着 Occupancy Network(占用网络) 技术的成熟,车辆具备了实时感知物理空间占用的能力。
  • 突破: 2025 年,主流厂商全面普及**“无图方案”**。车辆依靠实时视觉语义理解,像人一样在陌生路段也能流畅行驶,解决了高精地图成本高、鲜度差的顽疾。

三、 数据与训练:从“人工采集”到“数据飞轮”

自动驾驶的竞争本质上是算力数据规模的竞争。

维度 2015 (实验阶段) 2025 (大规模量产阶段)
数据源 几十台改装测试车 数百万台量产车全天候回传 Corner Cases
仿真能力 简单的几何场景模拟 生成式 AI 构建照片级、符合物理规律的仿真世界
算力底座 CPU/GPU 小集群 万卡级超算中心 (如 Tesla Dojo, 华为算力云)
反馈机制 手动打标 影子模式 (Shadow Mode) + 自动标注

四、 平台底层:从“CAN总线”到“车载以太网+eBPF”

为了支撑巨大的数据吞吐,底层技术栈也发生了重构:

  • 协议层: 传统的低速 CAN 总线演进为千兆车载以太网。采用 DDS/Zenoh 协议,确保海量视频数据在各计算单元间以微秒级时延传输。

  • 监控与诊断: 引入 eBPF(内核级观测) 技术。

  • 在不干扰智驾推理的前提下,实时监控系统内核的任务调度。一旦神经网络推理出现 以上的抖动(Jitter),诊断系统能即刻定位原因。

  • 日志系统: 从简单的错误日志进化为多模态快照。发生接管时,系统自动截取前后 的 4D 快照回传云端,作为模型进化的“燃料”。


总结:2025 年的行业共识

“智驾已不再是汽车的配置,而是汽车的灵魂。”

2025 年,智驾技术正式进入了**“大规模社会化运作”。它标志着 AI 第一次真正在复杂的物理现实世界中,实现了高安全等级的自主决策。它是“具身智能(Embodied AI)”**在移动出行领域的首个终极应用。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐