Karpathy 2025 年度总结：AI 变「怪」了，但这才是程序员最好的时代

2025 年，大模型没变得更「聪明」，而是更「怪」了。

极小狐

601人浏览 · 2025-12-23 15:43:49

极小狐 · 2025-12-23 15:43:49 发布

Karpathy 2025 年度总结：AI 变「怪」了，但这才是程序员最好的时代

前特斯拉 AI 总监、OpenAI 创始成员，AI 领域顶尖的技术布道者与教育家 Andrej Karpathy 近日在社交平台上发布了自己 2025 年度对于 AI 的观察与总结

2025 年，大模型没变得更「聪明」，而是更「怪」了。

1. RLVR：2025 年 AI 最大突破是 RLVR（可验证奖励强化学习），它让 AI 从人类示范模仿转向按目标自主试错琢磨出推理策略，实现更长思考链带来的效果提升，促使算力从堆参数转向精修模型，凸显有效试错的智能核心价值。

2. 幽灵智能：RLVR 塑造的 AI 呈现’特化智能’特征：在标准化任务中表现出色，但在实际应用中可能存在场景适应性的短板。AI 能力的评估应基于其目标应用场景的实际效果，而非笼统的性能排名。

3. Vibe Coding：2025 年 “Vibe Coding” 兴起，开发者可用日常语言直接生成代码，代码沦为可塑的临时载体，解放程序员精力聚焦核心逻辑，但也催生上下文管理与项目规范理解等 AI 编程工具新挑战

RLVR 让 AI 学会「顿悟」，Jagged Intelligence 暴露其「偏科战神」本质，Vibe Coding 则掀翻了编程门槛。

Karpathy 的总结揭示了一个真相：AI 正在从「模仿人类」走向「自成一派」，而这恰恰打开了软件开发的新范式。

这种「怪」，恰恰是程序员的黄金时代开启的信号。

2025 年，AI 编程玩出了哪些新花样？

RLVR：AI 开始「自己琢磨」了

2025 年最大的突破，是 RLVR（可验证奖励强化学习）。

简单说，以前我们教 AI 是「老师带徒弟」——人类示范，AI 模仿。现在变成了「修仙渡劫」——给 AI 一个目标（比如数学题答案），让它自己折腾，死活不管。

结果 AI 在「非对即错」的硬规则下，自己琢磨出了「列方程」「检查步骤」「回溯修正」这些推理策略。

DeepSeek R1 和 OpenAI o3 的「长思考」能力就是这么来的。

更绝的是，RLVR 让 AI 拥有了「想久一点就聪明一点」的能力。

模型大小不变，但你可以让它生成更长的思考链，效果照样提升。

2025 年，各大实验室把算力从「堆参数」转向「精修模型」，结果发现性价比更高。智能的核心，原来不是「见多识广」，而是「有效试错」。

「幽灵智能」：

AI 成了「偏科战神」

RLVR 带来的副作用，是 Karpathy 说的「幽灵智能」——AI 不是被「培养」的动物，而是被「召唤」的幽灵。

它的智能分布是锯齿状的：IMO 数学竞赛能碾压金牌得主，转头就被小学生级别的「越狱 Prompt」骗得团团转；能一分钟写千行优雅代码，却数不清「strawberry」里有几个 r。

2025 年，大家发现 Benchmark 已经没法信了。因为这些榜单本质是「可验证环境」，而 RLVR 就是靠可验证环境「刷经验」的。模型在榜单上「屠榜」，拿到生产环境该犯傻还是犯傻。

所以，别再问「这个模型强不强」了。

2025 年的正确问题是： 「这个模型在哪个场景下最怪、最擅长？」

Vibe Coding：

代码成了「可塑的临时载体」

2025 年，AI 跨过了那个神奇的阈值：用自然语言就能写程序。

Karpathy 年初无心插柳的「Vibe Coding」一词，成了年度最火暗号。它的本质很简单：代码不再是资产，而是草稿纸。

想做个小工具？直接跟 AI 说「给我个批量改文件名的脚本」，它咔咔生成。

2025 年，产品经理、运营和市场同学都开始「Vibe」出自己的工具。对程序员来说，这更让人兴奋——以前 80% 精力耗在语法细节，现在 AI 帮你搞定 80% 脚手架，你只管核心逻辑。

当然，新问题也来了：上下文管理。AI 怎么记住你之前「Vibe」了啥？怎么理解项目规范？这成了 2025 年 AI 编程工具的新战场。

AI「住」进了电脑

2025 年，AI 不再是你要去访问的网站，而是「住」在你电脑里的专业工程师同事。

Claude Code 运行在本地，直接操作你的文件和命令行。Cursor 则发明了「Vertical AI App」——把 LLM、垂直场景和工程化封装打包，让你能切换 AI 的「自主性」。

Karpathy 认为，大厂不会通吃所有场景。LLM 实验室会打造出「通用大学生」，但真正的机会是把 AI「大学生」培养成「专业工程师」

——这需要私有数据、领域知识，以及最企业级管控。

中国开发者需要什么样的「赛博同事」？

Karpathy在2025年度盘点中勾勒了AI编程的美好图景——"Vibe Coding"让编程回归直觉，Cursor证明了应用层的无限可能，Claude Code展现了智能体的真正面貌。这些都建立在开放、灵活的技术环境之上。

但回到现实，中国企业有着独特的技术生态：内网开发环境、老代码维护、严格的开发规范、信创适配要求…这些场景对AI编程工具提出了不同的挑战。

这正是驭码CodeRider 诞生的原因。

CodeRider - 为中国开发者量身定制的生产力工具

Cursor、Claude Code等工具在个人开发场景表现出色，而企业级AI编程需要更深度的整合能力。

驭码CodeRider，基于极狐GitLab原生集成的AI编程智能体，选择了一条不同的路径：

一体平台 · 全域智能

与 GitLab 原生融合，AI 拥有仓库「上帝视角」——直接理解元数据、MR 历史、CI 日志。每次 commit、代码审查、流水线失败，都成 AI 记忆。实现跨文件代码补全、多角色智能体编程、智能代码评审（拦截率提升 40%+），数据在 GitLab 端原生备份，AI 越用越懂你。

双轮驱动 · 效能倍增

AI Coding 轮：

IDE 侧智能助手，支持 MiniMax、DeepSeek、Qwen 等国内 SOTA 模型灵活切换

AI DevOps 轮：

GitLab UI 侧全生命周期智能平台，Pipeline 失败自动解析修复，安全扫描漏洞结合上下文生成补丁

两轮联动，全链路智能化闭环，效率提升 Max

三种部署 · 灵活安全

私有化、混合云、SaaS 全覆盖。物理隔离、信创适配、成本灵活，让中小企业也用得起「企业级 AI」。

SOTA 模型 · 持续领先

国内独家模型热插拔能力，MiniMax、DeepSeek、Qwen 出新版本无缝切换，无需重训或迁移。企业还能接入私有微调模型，构建专属编码体验。

Karpathy 点破了 2025 年的核心：

AI 正在从「被训练」走向「自进化」，从「云端工具」走向「本地伙伴」，从「通用」走向「领域专家」。

对开发者，这是最好的时代——Vibe Coding 让创意零门槛落地，RLVR 让 AI 成为真正的「思维外脑」。但也是最考验工具选型的时代。

驭码CodeRider 要做的，就是把 Karpathy 的蓝图，变成每个中国开发者指尖的「赛博同事」——一个住在你私有化 GitLab 里、懂你业务规范、能切换最强大脑、7×24 小时待命的 AI 同事。

2025 年，AI 变「怪」了。但正是这种「怪」，让软件开发的想象力真正自由。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI大模型开发学习指南：助你实现90%就业率和年薪72w+_AI爆了！最高年薪72w！

2048 AI社区

2026必备8个降AI率工具测评榜单

2048 AI社区

【珍藏必备】云原生大模型推理实战：从单机到多机多卡的企业级部署

2048 AI社区

所有评论(0)

查看更多评论

极小狐

@weixin_44749269

已为社区贡献10条内容