Karpathy 2025 年度总结:AI 变「怪」了,但这才是程序员最好的时代
2025 年,大模型没变得更「聪明」,而是更「怪」了。
Karpathy 2025 年度总结:AI 变「怪」了,但这才是程序员最好的时代

前特斯拉 AI 总监、OpenAI 创始成员,AI 领域顶尖的技术布道者与教育家 Andrej Karpathy 近日在社交平台上发布了自己 2025 年度对于 AI 的观察与总结
2025 年,大模型没变得更「聪明」,而是更「怪」了。
1. RLVR:2025 年 AI 最大突破是 RLVR(可验证奖励强化学习),它让 AI 从人类示范模仿转向按目标自主试错琢磨出推理策略,实现更长思考链带来的效果提升,促使算力从堆参数转向精修模型,凸显有效试错的智能核心价值。
2. 幽灵智能:RLVR 塑造的 AI 呈现’特化智能’特征:在标准化任务中表现出色,但在实际应用中可能存在场景适应性的短板。AI 能力的评估应基于其目标应用场景的实际效果,而非笼统的性能排名。
3. Vibe Coding:2025 年 “Vibe Coding” 兴起,开发者可用日常语言直接生成代码,代码沦为可塑的临时载体,解放程序员精力聚焦核心逻辑,但也催生上下文管理与项目规范理解等 AI 编程工具新挑战
RLVR 让 AI 学会「顿悟」,Jagged Intelligence 暴露其「偏科战神」本质,Vibe Coding 则掀翻了编程门槛。
Karpathy 的总结揭示了一个真相:AI 正在从「模仿人类」走向「自成一派」,而这恰恰打开了软件开发的新范式。

这种「怪」,恰恰是程序员的黄金时代开启的信号。
2025 年,AI 编程玩出了哪些新花样?
RLVR:AI 开始「自己琢磨」了
2025 年最大的突破,是 RLVR(可验证奖励强化学习)。
简单说,以前我们教 AI 是「老师带徒弟」——人类示范,AI 模仿。现在变成了「修仙渡劫」——给 AI 一个目标(比如数学题答案),让它自己折腾,死活不管。
结果 AI 在「非对即错」的硬规则下,自己琢磨出了「列方程」「检查步骤」「回溯修正」这些推理策略。
DeepSeek R1 和 OpenAI o3 的「长思考」能力就是这么来的。
更绝的是,RLVR 让 AI 拥有了「想久一点就聪明一点」的能力。
模型大小不变,但你可以让它生成更长的思考链,效果照样提升。
2025 年,各大实验室把算力从「堆参数」转向「精修模型」,结果发现性价比更高。智能的核心,原来不是「见多识广」,而是「有效试错」。
「幽灵智能」:
AI 成了「偏科战神」
RLVR 带来的副作用,是 Karpathy 说的「幽灵智能」——AI 不是被「培养」的动物,而是被「召唤」的幽灵。
它的智能分布是锯齿状的:IMO 数学竞赛能碾压金牌得主,转头就被小学生级别的「越狱 Prompt」骗得团团转;能一分钟写千行优雅代码,却数不清「strawberry」里有几个 r。
2025 年,大家发现 Benchmark 已经没法信了。因为这些榜单本质是「可验证环境」,而 RLVR 就是靠可验证环境「刷经验」的。模型在榜单上「屠榜」,拿到生产环境该犯傻还是犯傻。
所以,别再问「这个模型强不强」了。
2025 年的正确问题是: 「这个模型在哪个场景下最怪、最擅长?」
Vibe Coding:
代码成了「可塑的临时载体」
2025 年,AI 跨过了那个神奇的阈值:用自然语言就能写程序。
Karpathy 年初无心插柳的「Vibe Coding」一词,成了年度最火暗号。它的本质很简单:代码不再是资产,而是草稿纸。
想做个小工具?直接跟 AI 说「给我个批量改文件名的脚本」,它咔咔生成。
2025 年,产品经理、运营和市场同学都开始「Vibe」出自己的工具。对程序员来说,这更让人兴奋——以前 80% 精力耗在语法细节,现在 AI 帮你搞定 80% 脚手架,你只管核心逻辑。
当然,新问题也来了:上下文管理。AI 怎么记住你之前「Vibe」了啥?怎么理解项目规范?这成了 2025 年 AI 编程工具的新战场。
AI「住」进了电脑
2025 年,AI 不再是你要去访问的网站,而是「住」在你电脑里的专业工程师同事。
Claude Code 运行在本地,直接操作你的文件和命令行。Cursor 则发明了「Vertical AI App」——把 LLM、垂直场景和工程化封装打包,让你能切换 AI 的「自主性」。
Karpathy 认为,大厂不会通吃所有场景。LLM 实验室会打造出「通用大学生」,但真正的机会是把 AI「大学生」培养成「专业工程师」
——这需要私有数据、领域知识,以及最企业级管控。
中国开发者需要什么样的「赛博同事」?
Karpathy在2025年度盘点中勾勒了AI编程的美好图景——"Vibe Coding"让编程回归直觉,Cursor证明了应用层的无限可能,Claude Code展现了智能体的真正面貌。这些都建立在开放、灵活的技术环境之上。
但回到现实,中国企业有着独特的技术生态:内网开发环境、老代码维护、严格的开发规范、信创适配要求…这些场景对AI编程工具提出了不同的挑战。
这正是驭码CodeRider 诞生的原因。
CodeRider - 为中国开发者量身定制的生产力工具
Cursor、Claude Code等工具在个人开发场景表现出色,而企业级AI编程需要更深度的整合能力。
驭码CodeRider,基于极狐GitLab原生集成的AI编程智能体,选择了一条不同的路径:
一体平台 · 全域智能
与 GitLab 原生融合,AI 拥有仓库「上帝视角」——直接理解元数据、MR 历史、CI 日志。每次 commit、代码审查、流水线失败,都成 AI 记忆。实现跨文件代码补全、多角色智能体编程、智能代码评审(拦截率提升 40%+),数据在 GitLab 端原生备份,AI 越用越懂你。
双轮驱动 · 效能倍增
AI Coding 轮:
IDE 侧智能助手,支持 MiniMax、DeepSeek、Qwen 等国内 SOTA 模型灵活切换
AI DevOps 轮:
GitLab UI 侧全生命周期智能平台,Pipeline 失败自动解析修复,安全扫描漏洞结合上下文生成补丁
两轮联动,全链路智能化闭环,效率提升 Max
三种部署 · 灵活安全
私有化、混合云、SaaS 全覆盖。物理隔离、信创适配、成本灵活,让中小企业也用得起「企业级 AI」。
SOTA 模型 · 持续领先
国内独家模型热插拔能力,MiniMax、DeepSeek、Qwen 出新版本无缝切换,无需重训或迁移。企业还能接入私有微调模型,构建专属编码体验。
Karpathy 点破了 2025 年的核心:
AI 正在从「被训练」走向「自进化」,从「云端工具」走向「本地伙伴」,从「通用」走向「领域专家」。
对开发者,这是最好的时代——Vibe Coding 让创意零门槛落地,RLVR 让 AI 成为真正的「思维外脑」。但也是最考验工具选型的时代。
驭码CodeRider 要做的,就是把 Karpathy 的蓝图,变成每个中国开发者指尖的「赛博同事」——一个住在你私有化 GitLab 里、懂你业务规范、能切换最强大脑、7×24 小时待命的 AI 同事。
2025 年,AI 变「怪」了。但正是这种「怪」,让软件开发的想象力真正自由。
更多推荐



所有评论(0)