全自动游戏挂机神器,NitroGen:通用游戏代理的基础模型
(a) 每款游戏的时长显示覆盖范围广泛,其中 846 款游戏的数据时长超过 1 小时,91 款游戏超过 100 小时,15 款游戏超过 1,000 小时。我们收集公开可用的显示“游戏手柄叠加层”的视频。在《星际争霸II》和《Dota 2》等个别游戏中实现了超越人类的性能,但这些智能体的应用范围有限,训练成本高昂,并且依赖于很少能用于所有游戏的专用模拟器。——一个通用的视觉-动作模型,它接收游戏观察
分享文件:资源大全
链接:https://pan.xunlei.com/s/VObmBFFa7Q1PsEznMCr3rD0pA1
提取码:3x62
复制这段内容后打开迅雷,查看更方便
我们推出了NitroGen,一个面向通用游戏智能体的视觉-动作基础模型。该模型基于超过1000款游戏的4万小时游戏视频进行训练。NitroGen融合了三个关键要素: 1) 通过从公开的游戏视频中自动提取玩家动作构建的互联网规模的视频-动作数据集;2)能够衡量跨游戏泛化能力的多游戏基准测试环境; 3)采用大规模行为克隆训练的统一视觉-动作策略。NitroGen在多个领域展现出强大的能力,包括3D动作游戏中的战斗、2D平台游戏中的高精度控制以及程序生成世界中的探索。它能够有效地迁移到未见过的游戏中,与从零开始训练的模型相比,任务成功率的相对提升高达52%。我们发布了数据集、评估套件和模型权重,以推动通用具身智能体的研究。

概述。NitroGen由三个主要组件构成:(1) 多游戏基础代理(中心) ——一个通用的视觉-动作模型,它接收游戏观察结果并生成游戏手柄动作,从而实现跨多个游戏的零失误游戏体验,并为新游戏的微调奠定基础;(2) 通用模拟器(左) ——一个环境封装器,允许通过 Gymnasium API 控制任何商业游戏;(3) 互联网规模数据集(右) ——规模最大、种类最丰富的开源游戏数据集,由 40,000 小时的公开游戏视频整理而成,涵盖 1,000 多款游戏,并提取了动作标签。
介绍
互联网规模多游戏视频动作数据集
行动质量控制

数据集分析

实验
现成的多游戏功能

未见过的比赛的赛前训练迁移

结论
本文介绍了一种名为 NitroGen 的方法,用于扩展视频游戏智能体的基础预训练规模,并展示了互联网预训练如何产生通用策略。我们利用新的公开数据源构建了一个互联网规模的视频动作数据集,并通过成功训练一个多游戏策略,验证了其有效性。NitroGen 在微调实验中展现出良好的泛化能力。通过降低在新环境下训练智能体的门槛,NitroGen 为开发更强大、更通用的智能体奠定了基础。
BibTeX
@misc{Magne2025NitroGen,
title = {NitroGen: An Open Foundation Model for Generalist Gaming Agents},
author = {Magne, Loic and Awadalla, Anas and Wang, Guanzhi and Xu, Yinzhen and
Belofsky, Joshua and Hu, Fengyuan and Kim, Joohwan and Schmidt, Ludwig and
Gkioxari, Georgia and Kautz, Jan and Yue, Yisong and Choi, Yejin and
Zhu, Yuke and Fan, Linxi},
year = {2025},
howpublished = {\url{https://nitrogen.minedojo.org/}},
}
更多推荐




所有评论(0)