别再学写代码了,顶级工程师现在在学管理AI agent | 值得一读
AI时代下软件工程师的角色正在从"写代码"转变为"管理AI Agent",需要具备协调多个Agent、检查进度和处理问题的能力。访谈指出初级工程师可能比资深者更具优势,因其更易接受AI工具且"无历史包袱"。要充分发挥AI效能,代码库需满足测试充分、文档一致和风格统一三大要求。而优秀软件与普通软件的差距在于对细节的打磨和"品味&q
最近看了斯坦福 Mihail Eric 和哈佛商学院 Rem Koning 的一个访谈,讲的是 AI 时代软件工程师的角色变迁,里面有几个观点挺反直觉的,分享给大家。

这个视频最核心的论点不是"AI 会不会取代程序员"——这个问题已经被说烂了——而是更具体地在问:顶级工程师的工作内容正在变成什么? 说实话,他们给出的答案挺有意思:从"写代码"变成"管 Agent"。另外有一个观点我觉得值得重点关注,就是初级工程师在这轮转型里可能比资深工程师更有优势,理由是"没有包袱"。这个逻辑我基本认同,但也有些地方作者没想得特别透,后面深度思考里会说。
顶级开发者的工作正在变成什么
现在讨论 AI 写代码,很多人可能还停留在"Copilot 帮我补全"的阶段。但访谈里描述的场景已经进了一步:真正的 top 工程师在做的,是协调多个 Agent 并行处理不同任务,自己负责在它们之间切换上下文、检查进度、处理卡点。
听起来很像团队管理者。Mihail Eric 也明确用了这个类比——你是经理,Agent 是实习生,区别在于实习生出错的速度比人快得多,错误也会叠加放大。

所以"循序渐进"就变得很重要。不是一次性启动 10 个 Agent 让它们各跑各的,而是先把一个 Agent 调到稳定可信赖,确认它能独立完成一件事,再引入第二个。这个过程里,你需要随时知道每个 Agent 做到了哪里、卡在哪里,这就是所谓的"上下文切换(Context switching)"能力。
代码库要让 Agent 不懵
Agent 会快速放大错误,这不是 Agent 本身的问题,是基础环境的问题。一个对 Agent 友好的代码库,需要满足三点:
-
测试要充分。Agent 需要明确的"契约"才能知道什么叫对、什么叫错,测试覆盖率就是这个契约。
-
文档和代码要一致。Readme 写的是一套逻辑,实际代码跑的是另一套,人能靠经验推断,Agent 不行,它会照着文档走进坑里。
-
风格要统一。API 设计、代码规范、命名习惯,得有一套一以贯之的模式。Agent 在面对多种实现方式时会困惑,统一规范是减少它出错的最直接手段。
初级工程师的处境
现在找工作确实很难。疫情期间过度招聘、裁员,毕业生数量又在涨,加上企业开始用 AI 重新评估初级岗位的必要性,这几件事叠在一起,初级工程师的处境是访谈里说的"完美风暴"。
但访谈的核心论断是:初级工程师在适应 AI 工具这件事上,反而比资深工程师更快。
原因很简单:拥有20 年经验的工程师已经有了自己的习惯,已经有了自己的思维墙,很多人对 AI 工具的第一反应是抗拒,或者只在边缘场景用用,不敢真正依赖。新人没有这个包袱,他们会更自然地把 AI 当成工作流的一部分,试错的心理成本也更低。

访谈里用了一个词:"Good naivety(良好的天真)"。不是真的什么都不懂,而是没被行业习惯固化,遇到复杂问题不会本能地绕开,敢于直接去啃。

计算机科学基础训练的价值在这里也很关键——能把一个复杂系统拆解成子问题,愿意钻进底层去找 bug 而不是绕过它,这种思维方式在 AI 时代不会贬值,因为 Agent 出错的时候,最终还是需要人来定位和修复。
功能性软件和卓越软件的差距从哪来
AI 可以快速生成一个能用的版本,这个已经不稀奇了。但访谈里提出了一个问题:为什么有些软件就是让人觉得好用、精致,有些就是凑合能跑?
答案是"品味(Taste)"。

这个品味不是天生的,是在不断实验和打磨里积累的。Anthropic 的团队自己就在用 Claude 重写 Claude 的代码,不停试错,看什么有效、什么没用。实验本身就是工作流,不是偶尔为之的事。
好软件和凑合软件的差距,往往在最后 20% 的功能里。能不能在基本跑通之后,继续投入精力去扩展边界场景、处理那些"理论上不常见但实际上很烦人"的情况——这才是真正拉开差距的地方。
商业层面的终局

Rem Koning 的观点更往前一步:未来核心能力叫"分配智能(Allocate intelligence)"。
他的意思是,AI 原生组织的关键不是让 AI 帮人减负,而是让 AI 直接面对客户,把人从循环里移出去。AI 处理前端服务,人处理异常和迭代。
更激进的预测是:当 AI Agent 开始相互沟通协作,而不仅仅是各自执行任务,商业价值的量级会跳一个档次。能搭出这种系统的公司,将会解锁完全不同规模的市场。
深度思考
"管理 Agent"的技能比"使用 Agent"难得多:会用 Cursor 或 Claude 写代码,和能协调多个 Agent 稳定完成复杂任务,是两件差距很大的事。前者现在门槛很低,后者还没几个人真正做到,这个空间值得认真对待。
代码库质量的重要性被低估了:引入 Agent 之前先把测试、文档、风格规范做好,这听起来是老生常谈,但在 Agent 场景下它的权重完全不一样——烂代码库让人类工程师慢,让 Agent 出错,两者不是一个数量级。
"Good naivety"有时效性:初级工程师的无包袱优势,在全力拥抱 AI 工具的头两年最明显。等行业形成新的最佳实践之后,这个优势就会收窄,转化为另一种形式的经验积累。所以这个窗口期要利用好,不是等待,是主动实验。
Taste 是可以刻意训练的:访谈里说"品味",但没说怎么建立。我的判断是:大量使用 + 大量比较。用过很多烂工具之后你才知道好工具好在哪,做过很多凑合的版本之后才知道精致意味着什么。这个不能跳过,要靠量。
视频链接:https://www.youtube.com/watch?v=wEsjK3Smovw
更多推荐


所有评论(0)