快速入门大模型在Carla平台进行决策推理和视觉语言大模型微调

夏融化了这季节

6510人浏览 · 2025-02-23 11:13:20

夏融化了这季节 · 2025-02-23 11:13:20 发布

快速入门大模型在Carla平台进行决策推理与微调

目前大模型，AI正火热，GPt，DeepSeek等等，曾一度火爆全网，废话少说，大家赶紧学着用起来。
b站的视频简介：
Deepseek-R1火爆全网！如何利用大模型对接自动驾驶Carla做决策推理？(上)

该工程可以帮助你快速获取以下知识：
1.学习如何调用大模型，包括大语言模型LLM和多模态大语言模型VLM。
2.学习如何调用大模型对接Carla进行决策动作推理。
3.自主学习调节大模型的prompt。
4.快速掌握视觉语言大模型VLM的微调实战方法之一。

购买之后是代码+代码工程的答疑+社区交流群。以上知识会让大家学会掌握，但是不能说是关于大模型的各种教学，毕竟蕴含的知识太广泛。
如果你嫌贵，想自己多花几个月去学习也可以。这里目的是让大家有方向，更快速掌握理解大模型的落地实战。

购买须知：
1.一经购买不可退款，购买前可以尽情了解清楚情况，购买后不得已不适合自己为由退款。
2. 该工程版权归属b站算法舵手，自主学习即可，请勿外传，咸鱼淘宝倒卖和上传github公开！！！感谢支持和配合。
3. 工程只是个demo，可能需要进一步优化，比如换一个场景之后，LLM收集环境的文本信息需要进一步调节，那些都不是万能的。这只是个demo！！!，可能推理不准等等问题，但是可以调出比较好的视觉效果，如我视频调的。
4. 现在有的效果已经都录好视频，大家可以上主页查看效果。我电脑加载权重跑VLM超级卡，所以没录VLM的视频，大家最好在组里的服务器去跑试试，或者花钱买API。
5. 目前已社区交流为主，1对1答疑辅导毕设论文等暂时没时间接。
6. 这个工程社区没有教carla的场景搭建，leaderboard框架很难搭建，想学习怎么搭建，可以看我们这个单智能体强化学习系列：
从零开始学习自动驾驶端到端深度强化/模仿学习实战项目
里面自主搭建了好多场景，代码也比较容易看懂。
7.代码是基于carla leaderboard改的，里面代码量挺多的，主要学习大模型和carla之间的信息交互部分即可，场景也是拿leaderboard榜单上面方法用的场景改的。介意者勿拍。
8.显卡显存：如果只用API，那么显卡只需要能跑carla0.9.13就行，只是GTX-1050以上: 可参考显卡天梯度：

GTX 1050 显卡的性能怎么样？ - 知乎 (zhihu.com)

如果用本地权重，那么qwen-vl-7b都需要17G显存了，而且如果要下载的模型权重越大，显存也会需要越多。另外显卡本身需要更高配置，不然推理贼卡或者跑不了，显卡至少要GTX-3系列及以上，确保高性能。一般推荐组里用的服务器，有桌面版的那种。

9.这个套餐基本是Carla的相关实战，暂时没有后续实战平台。
10.目前没有啥融合感知算法，因为可以直接从carla获取环境信息，就只是用LLM和VLM推理Carla决策，可以自行推广到任何具身智能仿真平台。
11.微调的方法是以自己收集的CARLA数据为例子，微调需要的硬件很高，我用的一张A100，大家自己查一查微调的硬件需求吧。还有微调内容刚出，视频录了SFT。
12. VLM的API的函数因为要money所以还没没写，只测试了vlm下载qwen2-vl权重的。但是vlm的api函数跟LLM基本一样，可以学完其他的自己练习加一下这个函数内容，不难。
13. 大模型和carla的版本是可以往越高的版本改。比如有学员已经自行调通了Qwen3和carla0.9.15版本的推理。

内容列表：
1.基于LLM的Carla动作推理，直线鬼探头场景，包括API和权重调用
2.基于VLM的Carla动作推理，直线鬼探头场景，包括API和权重调用
3.基于VLM的SFT微调Carla数据实战示例
4.基于VLM的GRPO微调Carla数据实战示例（硬件要求很高）

内容列表虽简单，但对于学习这方面知识的同学，会很有帮助。欢迎加入社区。

b站主页：算法舵手

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2026销售会话分析工具横评：灵听工牌 vs AI录音笔 vs 行业SaaS，谁更懂业务？

2048 AI社区

同一个模型，只改“外壳“性能狂飙22倍，Agent的瓶颈根本不在模型本身

摘要： HuggingFace工程师JoelNiklaus的实验颠覆了AI代理（Agent）性能的认知：同一开源模型DeepSeek-V4-Pro仅因外层执行机制（Harness）不同，在法律基准测试中得分从3.5%跃升至80.1%，成本仅为顶级闭源模型的1/7。研究表明，Harness作为模型的"操作系统"，管理流程、工具调用等12项任务，其质量直接影响Agent表现，甚至导