「AI 能写 90% 代码」——但新软件在哪？

作者说代理能处理 90% 的工作，评论区马上有人甩出真实案例：一位资深工程师用 Claude 重构一个老旧代码库，结果「一半功能完全消失，剩下的一半像被加密过」。最后，最有力的批评指向作者的傲慢：「水本身不是湿的，它让别的东西变湿。另一位说，AI 生成的测试用例里，连数学常数和引用的文献链接都是错的，但测试看起来通过了，因为 AI 在「睁眼说瞎话」。在这个状态下，有人提前离场回到 vim，有人烧着

御坂10101号

640人浏览 · 2026-02-15 22:15:49

御坂10101号 · 2026-02-15 22:15:49 发布

一个开发者博客声称 AI 代理已经能包办他 90% 的代码，而且连 IDE 都不用了——这事儿听起来像科幻，但评论区里直接炸开了锅，有人反问：「新房子在哪？」意思是，如果真有这么强的生产力提升，整个社会应该能看见，可软件行业的产出增长却远没到那个份上。这场发生在 Hacker News 的讨论，把 AI 代理从神坛拉回了尘土飞扬的现实。

文章作者声称自己从 2021 年还用 Copilot 辅助 IDE 写代码，到 2026 年已经彻底回到 neovim，只保留「跳转到定义」这一个功能。他的核心论点很直接：模型能力才是唯一关键，代理的执行框架（agent harness）创新不过像九十年代的编译器优化，边际效益有限。去年 Claude Code 只能写四分之一的代码，今年最新 Opus 能写十分之九——虽然仍需人工审查和微调，但模型已经能自行完成大部分调整。

这番话在技术圈里砸出了一道裂缝。表面上看，开发者们争论的是模型好坏、IDE 存亡，但撕开的却是三个更扎心的问题：成本烧不起、工作保不住、代码烂到爆。

「必须用 frontier 模型，否则就是浪费时间」

作者的建议很极端：别省钱用 Sonnet 那种二流模型，不仅产出差，还会让你学到错误的经验。直接砸钱买 Opus 或 GPT-7.9-xhigh-with-cheese，反正就这几年。评论区立刻有人算了一笔账：一个月烧掉 800 美元（约 5800 人民币）的代币费，结果项目越庞大、每个请求的平均花费越高，这简直是「代币赌博」（token madness）。

更讽刺的是，作者自己正在创业做 exe.dev，专门提供代理用的沙箱环境——所以他当然让大家习惯为代理付费。有人直接点破：「他这是在软广，让你习惯花钱用代理，然后顺便买个沙箱服务。」这不是阴谋论，而是技术讨论里常见的利益冲突。

就业恐慌：CEO 不会让你每天只干四小时

作者说现在编程比任何时候都快乐，因为自己终于有时间写那些「一直想做的小工具」。这种「何不食肉糜」的腔调激怒了许多打工人。有人描绘了一个残酷的思想实验：一个 8 人工程师团队用 AI 效率翻倍，CEO 会选哪个方案？

a) 让大家每天只干四小时，保持工作生活平衡
b) 直接裁掉四人，让剩下的人继续干八小时

答案不言自明。更狠的是，被裁的人还能以更低价格抢活干，形成「卷王螺旋」。用一位评论者的话说：「AI 不会取代你，那个即将被裁掉、输不起的同事才会取代你。」

这种焦虑不是杞人忧天。技术行业正处于大规模裁员潮，很多人怀疑公司正用 AI 当借口压缩人力成本。这可不是「手工匠人不接受电动工具」的浪漫叙事，而是实实在在的房贷车贷压力。一位开发者用资本轨道力学打了个比方：50 万美元是个人财务的「逃逸速度」，低于这条线就得不停挣扎求生。AI 让这趟上升之路更凶险了。

vibecoding 灾难：你的代码像加密过

技术层面的反对声浪更具体。作者说代理能处理 90% 的工作，评论区马上有人甩出真实案例：一位资深工程师用 Claude 重构一个老旧代码库，结果「一半功能完全消失，剩下的一半像被加密过」。作者本人花了 20 年时间维护这套系统，比谁都清楚，手工重写反而更快。但管理层将 LLM 采纳率设为考核 KPI，团队只能硬着头皮用，最终「像用霰弹枪往自己脚上连开两枪」。

这就是「vibecoding」——不懂技术的人指挥 AI 写代码。一位开发者分享：AI 想在客户端做数据库写入逻辑，根本没考虑身份验证，新手绝对看不出来。另一位说，AI 生成的测试用例里，连数学常数和引用的文献链接都是错的，但测试看起来通过了，因为 AI 在「睁眼说瞎话」。

更糟的是质量保证流程的崩塌。代理生成的代码量巨大，99% 的开发者看都不看就点「接受」，因为审查成本太高。结果代码怎么跑的、有没有漏洞，没人真正知道。一位工程师吐槽：「现在我的主要工作从写代码变成了给 AI 擦屁股，而且 AI 犯的错误比人类更诡异，调试起来更反直觉。」

IDE 死了吗？其实宝座还在

作者弃用 IDE 回到 vim 的言论，在技术社区里显得过于激进。不少人反驳：IDE 的代码浏览能力对理解系统至关重要。在命令行里靠运气找上下文是倒退，而在 IDE 里可以高亮函数、精准投喂给代理。更有人预言：IDE 将带着 AI 能力王者归来，目前的 CLI 热只是因为暴露了旧 IDE 的能力不足。

自动补全（autocomplete）反而被认为比完整代理更实用。前者保持「流状态」，后者强制任务切换，还要花一分钟等结果，最后生成一大坨代码，大多数人看都不看就合并。这种工作方式不是在编程，是在玩代币抽奖。

技术真相：卡在中间状态

剥开所有争论，共识是 AI 代理确实变强了，但整个工程体系没跟上。Agent harness（执行框架）的创新被忽视，它负责调用模型和执行工具调用，目前状态简陋得像「九行代码的循环」。真正的问题是失败恢复：当代理点错按钮、遇到验证码或页面渲染异常时，现有框架只会盲目重试。未来的突破在于结构化状态检查点，让代理能回滚到上一个已知良好状态，而不是从头再来。

更有趣的是，很多资深工程师发现，所谓「10 倍效率提升」其实发生在清除技术债务、写内部工具这类「脏活累活」上。核心产品开发仍然需要大量人工协调。就像一位评论者说的：「你可以锯得更快，但木材供应和市政审批才是瓶颈。整个工地的布局都错了。」

经济学的诅咒

这场讨论暴露了一个根本矛盾：技术进步的速度，与人类社会消化变革的速度严重不匹配。农业工业化用了百年，让农民从 40% 降到 1% 的劳动力，但伴随的是明确的社会收益——大家不用为了吃饭而种地。软件行业的效率提升，却可能让大量中产阶级直接掉进经济不安全的深渊，没有配套的社会缓冲机制。

一位开发者算了个账：AI 生成的代码再多，也解决不了需求评审、架构设计、利益相关者沟通这些环节。而这些恰恰决定了一个软件有没有价值。另一位指出，过去三年 Steam 发布的游戏数量从 2023 到 2024 跃升了 5000 款，但 2024 到 2025 又停滞了——说明即使有 AI，找到受众、完成商业闭环依然是最大难关。

最后，最有力的批评指向作者的傲慢：「水本身不是湿的，它让别的东西变湿。」这种咬文嚼字的技术正确，恰恰暴露了他对反对论点的不理解。反 LLM 的声音不是「反对电动工具」的浪漫主义，而是涵盖环境成本（烧煤发电让程序员「开心」）、知识产权盗窃、训练数据合法性、以及系统失控风险的综合担忧。

这场讨论没有赢家。它提醒我们：AI 代理确实改变了编程，但改变的方向不是简单的『效率提升』，而是让整个行业进入一个调试成本更高、经济更不稳定、质量更不可测的中间态。 在这个状态下，有人提前离场回到 vim，有人烧着代币赌一个不确定的未来，更多人则在困惑：我的下一份工作，究竟是教 AI 写代码，还是给 AI 写的代码擦屁股？

在这里插入图片描述