【claude】Karpathy:去年12月起,Agent 彻底颠覆编程
Andrej Karpathy 宣称 AI 编程智能体在去年十二月发生质变,从基本不可用跃升为能独立完成复杂项目。他用三十分钟搭建了本地视频分析看板,全程零人工干预。软件工程正从"写代码"转向"编排 Agent",顶尖工程师的杠杆效应被无限放大。
摘要:Andrej Karpathy 宣称 AI 编程智能体在去年十二月发生质变,从基本不可用跃升为能独立完成复杂项目。他用三十分钟搭建了本地视频分析看板,全程零人工干预。软件工程正从"写代码"转向"编排 Agent",顶尖工程师的杠杆效应被无限放大。
关键词:Karpathy、AI Agent、编程革命、vibe coding、智能体编排、软件工程、DGX Spark、DHH
大家好,我是小枫。
昨天 Andrej Karpathy 发了一条长帖,核心观点只有一句话:去年十二月之前,编程智能体基本不可用;十二月之后,它们真正起效了。
这不是小幅迭代,而是明确的质变。模型的生成质量、长期连贯性以及韧性都得到了显著提升,已经完全能够独立攻克庞大且耗时的任务。

💡 国内如何顺畅使用 Claude?本文全系使用 weelinking,全系模型支持。
一、三十分钟搞定周末项目
为了具象化这种改变,Karpathy 分享了自己上周末构建本地视频分析看板的经历。
他仅向 AI 提供了家中 DGX Spark 服务器的本地 IP 和账密,并用自然语言下达了一连串指令:
- 登录系统、配置 SSH 密钥
- 部署 vLLM、下载并测试 Qwen3-VL 模型
- 搭建视频推理服务器端点
- 构建基础 Web UI 看板
- 进行全面测试
- 使用 systemd 设置为系统服务
- 记录内存笔记并最终生成一份 Markdown 格式的报告
随后,智能体独立运行了约三十分钟。期间它遇到了多个问题,但全靠自己在网上检索解决方案并逐一克服。从编写代码、测试、调试到部署服务,智能体完成了所有工作并带着最终报告返回。
Karpathy 在此期间没有进行任何人工干预。
如果在三个月前,这绝对需要耗费整整一个周末的时间才能完成,但在今天,这仅仅是一个启动后就可以暂置一旁的三十分钟后台任务。

二、从代码编写者到 AI 编排者
基于这种技术跃迁,Karpathy 宣告:
自从计算机发明以来,人类在编辑器里一行行敲击代码的时代已经结束,软件工程的面貌变得让人认不出来。
全新的工作模式是:
- 启动多个 AI 智能体
- 用英语向它们分配任务
- 并行管理和审查工作成果
当下最大的技术红利,在于开发者能否不断攀升抽象层级,构建出能够长期运行的智能体编排系统。通过赋予系统合适的工具、记忆和指令,让其能够高效管理多个并行的代码生成实例。
在顶级的智能体工程加持下,开发者所能获得的杠杆效应已达到极高水平。
三、当然,还不完美
Karpathy 也坦承这种模式目前并非完美无缺。它依然需要:
| 维度 | 说明 |
|---|---|
| 宏观指导 | 人类提供高层次方向和判断力 |
| 品味与监督 | 审查质量、迭代优化 |
| 思路点拨 | 在关键节点给出灵感 |
| 场景适配 | 需求明确且易于验证的场景表现最佳 |
开发者现在的核心技能,变成了如何精准拆解任务,将适合的部分交由 AI 处理,并在边缘环节提供人工辅助。
四、打破 Linux 门槛与重塑系统设计
这种剧变引发了技术圈的强烈共鸣。
Ruby on Rails 创始人 DHH 表示:这是他试图让计算机听命于自己的四十年间,所见证的最大且最快的变革,而且过程出乎意料地有趣。
Karpathy 在回应 DHH 时提到,希望智能体能够大幅降低操作 Linux 系统的门槛,并表达了对 Omarchy 等相关项目的看好。未来的方向是设计出能够协助处理所有环境配置,甚至直接代为接管系统的 AI 技能库。
五、质疑与回应:生产环境真的行吗?
也有开发者提出了尖锐的质疑。
工程师 Rafał Kobyliński 表示:在处理生产环境代码以及 UI、网络连接、并发等难以测试的领域时,AI 的表现与去年相比似乎并没有明显提升。
Karpathy 直言:这很可能是使用方法存在问题。
他给出了具体建议:
- UI 层面:引入浏览器相关工具,能大幅提升处理能力
- 网络/并发:核心难点在于如何把仅存在于开发者大脑中的背景知识完整传递给智能体
- 破局关键:让关注的事物具备可测试性、可观测性和高清晰度
最终目的是将智能体置入更长周期的运行循环中,彻底消除人类在这个环节中造成的瓶颈。
Karpathy 借用了他在特斯拉时期总结的原则:
“人类干预即错误”——这套理念现在完全适用于软件工程领域。
六、顶尖工程师的价值将被进一步放大
随着 AI 编程能力的爆发,有观点认为未来成百上千人的开发团队可能会被少数几个提示词工程师所取代。
Karpathy 对这种看法予以了否定。
他认为将未来的开发者称为"提示词工程师"是一种严重的误解:
- 仅靠 vibe coding 的初级开发者现在也能勉强做出一些成果
- 但在行业顶尖水平的较量中,深厚的技术专业知识将比以往任何时候都更加重要
- 因为在 AI 赋予的超级杠杆作用下,专业能力的乘数效应正在被无限放大
七、好消息:工程师需求不降反升
其实大家不用太担心。新鲜出炉的统计数据显示,软件工程师需求正在飙升。
虽然图中的需求可能只是暂时情况,还反映不了长期趋势,但未来各大公司、小公司的业务自动化需求可能是无穷无尽的,对于软件工程师的需求不降反升值得期待。
八、总结
Karpathy 这条帖子的核心信息非常清晰:
| 要点 | 内容 |
|---|---|
| 质变时间点 | 2025 年 12 月,Agent 从不可用到真正起效 |
| 新工作模式 | 启动多个 Agent,并行编排,人类做监督 |
| 核心技能转变 | 从写代码到拆解任务 + 编排 Agent |
| 对顶尖工程师 | 杠杆效应无限放大,专业知识比以往更重要 |
| 对初级开发者 | vibe coding 能做基础工作,但天花板有限 |
| 就业市场 | 需求不降反升,自动化带来新增量 |
软件行业已经彻底告别了过去的常规状态。你准备好了吗?
📖 推荐阅读
如果这篇对你有帮助,以下文章你也会喜欢:
- 把 Claude Code 用成工程工具:8 条黄金法则与一套可复用工作流 — CC Switch 配置好之后,这 8 条法则能让你的 Claude Code 效率再翻一倍
- Claude Code 正式引入 Git Worktree 原生支持:Agent 全面实现并行独立工作 — 多 API 配好了,再学学多 Agent 并行工作,彻底解放生产力
- Claude Code 省 Token 终极指南:从烧钱到精打细算 — 接了 weelinking 按量付费,正好配上这篇,控制好成本
💡 国内的程序员丝滑使用claude weelinking
🚀 整个系列的核心理念:你不需要变成程序员,你只需要从"找人做"变成"自己能做"。
更多推荐


所有评论(0)