NVIDIA AIpamayo—面向辅助驾驶的开源VLA推理模型
举例而言,在行人密集且紧邻自行车道的区域,搭载 AR1 的智能汽车可通过思维链进行推理:首先采集行驶路径数据,同时整合推理轨迹(即系统对采取特定操作的解释说明),继而利用这些信息规划后续行驶路线,例如主动避让自行车道或为潜在横穿马路的行人提前减速或停车。举例而言,在行人密集且紧邻自行车道的区域,搭载 AR1 的智能汽车可通过思维链进行推理:首先采集行驶路径数据,同时整合推理轨迹(即系统对采取特定操
1、在 NeurIPS 大会上,NVIDIA 推动面向数字与物理 AI 的开源模型发展
举例而言,在行人密集且紧邻自行车道的区域,搭载 AR1 的智能汽车可通过思维链进行推理:首先采集行驶路径数据,同时整合推理轨迹(即系统对采取特定操作的解释说明),继而利用这些信息规划后续行驶路线,例如主动避让自行车道或为潜在横穿马路的行人提前减速或停车。
NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的开源行业级 VLA 推理模型 NVIDIA DRIVE Alpamayo-R1。此外,一项新的独立基准测试认可了 NVIDIA Nemotron 模型及数据集的开放性与透明度。
在全球顶级 AI 会议 NeurIPS 上,NVIDIA 发布了支持科学研究的开放式物理 AI 模型与工具,其中包括面向辅助驾驶的行业级开源 VLA 推理模型 Alpamayo-R1。在数字 AI 领域,NVIDIA 推出了面向语音处理与 AI 安全领域的新模型及数据集。
NVIDIA DRIVE Alpamayo-R1 为辅助驾驶开辟了全新的研究前沿
NVIDIA DRIVE Alpamayo-R1(AR1)作为面向辅助驾驶研究的开源 VLA 推理模型,创新性地将思维链 AI 推理与路径规划技术深度融合。该技术对于提升辅助驾驶系统在复杂路况下的安全性以及实现 L4级自动驾驶至关重要。
举例而言,在行人密集且紧邻自行车道的区域,搭载 AR1 的智能汽车可通过思维链进行推理:首先采集行驶路径数据,同时整合推理轨迹(即系统对采取特定操作的解释说明),继而利用这些信息规划后续行驶路线,例如主动避让自行车道或为潜在横穿马路的行人提前减速或停车。
为任意物理 AI 应用场景定制 NVIDIA Cosmos
NVIDIA 研究中心推动语言 AI 创新
在 NeurIPS 大会上发布了数十篇 NVIDIA 研究论文,以下几篇是推进语言模型发展的重点研究成果:
- Audio Flamingo 3:通过完全开源的大型音频语言模型推动音频智能发展:该大型音频语言模型具备跨语音、声音与音乐的推理能力,可理解并推理长达 10 分钟的音频片段,在超过 20 项基准测试中取得了业界领先的性能表现(SOTA)。
- Minitron-SSM:通过分组感知 SSM 剪枝实现高效混合语言模型压缩:该研究提出一种可压缩混合模型的新剪枝方法,通过对 Nemotron-H 8B 模型进行剪枝与蒸馏,将其参数从 80 亿压缩至 40 亿。所得模型在精度上超越同规模模型,同时实现推理吞吐量两倍提升。
- Jet-Nemotron:基于后神经架构搜索 (Post Neural Architecture Search, PostNAS) 的高效语言模型:该研究提出了一种高性价比的后训练流程,用于开发新型高效语言模型架构,并介绍了通过该流程生成的混合架构模型系列。该系列模型在精度上达到或超越了目前领先的全注意力基线模型的同时,显著提升生成吞吐量。
- Nemotron-Flash:面向延迟优化的混合小语言模型:该项目提出一种全新小语言模型(SLM)架构,其设计核心从参数数量转向真实场景的延迟优化,最终在速度与精度方面均达到业界领先水平。
- ProRL:延长强化学习拓展大语言模型的推理边界:延长强化学习(ProRL)是一种通过延长模型训练周期提升性能的技术。在这篇NeurIPS论文中,NVIDIA 研究人员阐述了该方法如何使模型在推理能力上持续超越基础模型。
mayo 1
2、基于 NVIDIA Alpamayo 构建具备推理能力的辅助驾驶汽车
近期,NVIDIA 推出了 Alpamayo 系列,该系列包含模型、仿真工具及数据集,旨在推动安全可靠的推理型辅助驾驶汽车开发。我们的目标是为研究人员和开发者提供一个灵活、快速且可扩展的平台,用于在真实的闭环环境中评估并最终训练新一代基于推理的辅助驾驶架构。
第一部分:Alpamayo 1——面向辅助驾驶的开源 VLA 推理模型
第二部分:面向大规模多样化辅助驾驶数据的物理 AI 数据集
该数据集包含了 25 个国家、超过 2,500 座城市共计 1,727 小时的驾驶视频数据(覆盖范围如下图所示,颜色深浅代表各国收录的片段数量)。数据采集范围涵盖多样化的交通状况、天气条件、道路障碍物及行人活动。整体数据集由 310,895 段独立视频片段构成,每段时长均为 20 秒。所有片段均包含多摄像头与激光雷达的传感器数据,其中 163,850 个片段还同步收录了毫米波雷达数据。
第三部分:AlpaSim——面向辅助驾驶评估的闭环仿真框架
AlpaSim 基于微服务架构构建,其核心是运行时(见图 5),该组件负责协调所有仿真活动。各独立服务如驱动程序、渲染器、交通仿真器、控制器和物理引擎均在独立进程中运行,且可分配至不同 GPU。
结论:综合分析
强大的端到端模型是辅助驾驶未来的关键,而 AlpaSim 提供了快速测试和迭代这些模型的能力,从而加速研究进程。本文介绍了 Alpamayo 1 模型、物理 AI 数据集以及 Alpasim 仿真架构。它们共同构成了一套完整的基于推理的辅助驾驶系统开发框架,包含模型、海量训练数据以及用于评估的仿真器。
3、NVIDIA 推出 Alpamayo 系列开源 AI 模型与工具,加速安全可靠的推理型辅助驾驶汽车开发
Alpamayo 为智能汽车注入推理能力,使其得以应对罕见场景,在复杂环境中安全行驶,并解释其驾驶决策的能力,这为安全、可规模化的自动驾驶奠定了基础;
太平洋时间 2026 年 1 月 5 日 ——NVIDIA 发布NVIDIA Alpamayo 系列开源 AI 模型、仿真工具及数据集,旨在推动安全可靠的推理型辅助驾驶汽车开发。
Alpamayo 系列引入基于思维链的 VLA 推理模型,为辅助驾驶决策注入类人的思维能力。
Alpamayo 将开放模型、仿真框架与数据集三大支柱整合为统一开放的生态系统,任何汽车开发者或研究团队均可在此基础上进行研发。
在 CES 上,NVIDIA 推出:
- Alpamayo 1:业界首款面向辅助驾驶研究社区设计的思维链 VLA 推理模型,现已在Hugging Face 上发布。基于 100 亿参数架构,该模型通过视频输入生成行驶轨迹,同时给出推理思路,能够清晰展示每项决策背后的逻辑。开发者既可将 Alpamayo 1 调整为更精简的运行时模型部署于车端,也可将其作为辅助驾驶的基础架构,构建诸如基于推理的评估器和自动标注系统等开发工具。Alpamayo 1 提供开放模型权重和开源推理脚本。该系列的后续模型将具备更大的参数规模、更精细的推理能力、更灵活的输入输出方式以及更丰富的商用选项。
- AlpaSim:一款面向高保真辅助驾驶开发、完全开源的端到端仿真框架,现已在GitHub 上公开发布。该框架提供逼真的传感器建模、可配置交通动态,以及可扩展的闭环测试环境,支持快速验证与策略优化。
- 物理 AI 开放数据集:NVIDIA 提供多元化的大规模辅助驾驶开放数据集。该数据集包含超过 1700 小时的驾驶数据,覆盖广泛的地理区域和环境条件,涵盖推动推理架构发展所必需的罕见且复杂的真实世界极端场景。这些数据集已在Hugging Face 上开放使用。
这些工具共同构建了一个自我强化的开发闭环,用于推理型辅助驾驶堆栈的开发。
4、Alpamayo 产品组合的核心组件
Alpamayo 1:VLA 推理模型
这是业界首款面向移动出行领域的开放式大规模视觉 - 语言 - 动作推理模型。NVIDIA Alpamayo 1 处理视频和传感器输入,应用基于语言的因果推理并生成驾驶轨迹,同时解释其决策以实现透明和安全审核。
AlpaSim:开放式仿真框架
NVIDIA AlpaSim 是一款完全开源的辅助驾驶仿真框架,可提供逼真的传感器建模、可配置的交通动态和可扩展的闭环测试环境。这可在数百万英里的虚拟里程中实现快速策略迭代和验证。
物理 AI 开放数据集
利用大规模辅助驾驶开放数据集,其中包含 1700 多个小时的驾驶数据,涵盖广泛的地理区域和环境条件。
时间 :2026/1/27
更多推荐


所有评论(0)