一个开发者博客声称 AI 代理已经能包办他 90% 的代码,而且连 IDE 都不用了——这事儿听起来像科幻,但评论区里直接炸开了锅,有人反问:「新房子在哪?」 意思是,如果真有这么强的生产力提升,整个社会应该能看见,可软件行业的产出增长却远没到那个份上。这场发生在 Hacker News 的讨论,把 AI 代理从神坛拉回了尘土飞扬的现实。

文章作者声称自己从 2021 年还用 Copilot 辅助 IDE 写代码,到 2026 年已经彻底回到 neovim,只保留「跳转到定义」这一个功能。他的核心论点很直接:模型能力才是唯一关键,代理的执行框架(agent harness)创新不过像九十年代的编译器优化,边际效益有限。去年 Claude Code 只能写四分之一的代码,今年最新 Opus 能写十分之九——虽然仍需人工审查和微调,但模型已经能自行完成大部分调整。

这番话在技术圈里砸出了一道裂缝。表面上看,开发者们争论的是模型好坏、IDE 存亡,但撕开的却是三个更扎心的问题:成本烧不起、工作保不住、代码烂到爆

「必须用 frontier 模型,否则就是浪费时间」

作者的建议很极端:别省钱用 Sonnet 那种二流模型,不仅产出差,还会让你学到错误的经验。直接砸钱买 Opus 或 GPT-7.9-xhigh-with-cheese,反正就这几年。评论区立刻有人算了一笔账:一个月烧掉 800 美元(约 5800 人民币)的代币费,结果项目越庞大、每个请求的平均花费越高,这简直是「代币赌博」(token madness)。

更讽刺的是,作者自己正在创业做 exe.dev,专门提供代理用的沙箱环境——所以他当然让大家习惯为代理付费。有人直接点破:「他这是在软广,让你习惯花钱用代理,然后顺便买个沙箱服务。」 这不是阴谋论,而是技术讨论里常见的利益冲突。

就业恐慌:CEO 不会让你每天只干四小时

作者说现在编程比任何时候都快乐,因为自己终于有时间写那些「一直想做的小工具」。这种「何不食肉糜」的腔调激怒了许多打工人。有人描绘了一个残酷的思想实验:一个 8 人工程师团队用 AI 效率翻倍,CEO 会选哪个方案?

a) 让大家每天只干四小时,保持工作生活平衡
b) 直接裁掉四人,让剩下的人继续干八小时

答案不言自明。更狠的是,被裁的人还能以更低价格抢活干,形成「卷王螺旋」。用一位评论者的话说:「AI 不会取代你,那个即将被裁掉、输不起的同事才会取代你。」

这种焦虑不是杞人忧天。技术行业正处于大规模裁员潮,很多人怀疑公司正用 AI 当借口压缩人力成本。这可不是「手工匠人不接受电动工具」的浪漫叙事,而是实实在在的房贷车贷压力。一位开发者用资本轨道力学打了个比方:50 万美元是个人财务的「逃逸速度」,低于这条线就得不停挣扎求生。AI 让这趟上升之路更凶险了。

vibecoding 灾难:你的代码像加密过

技术层面的反对声浪更具体。作者说代理能处理 90% 的工作,评论区马上有人甩出真实案例:一位资深工程师用 Claude 重构一个老旧代码库,结果「一半功能完全消失,剩下的一半像被加密过」。作者本人花了 20 年时间维护这套系统,比谁都清楚,手工重写反而更快。但管理层将 LLM 采纳率设为考核 KPI,团队只能硬着头皮用,最终「像用霰弹枪往自己脚上连开两枪」。

这就是「vibecoding」——不懂技术的人指挥 AI 写代码。一位开发者分享:AI 想在客户端做数据库写入逻辑,根本没考虑身份验证,新手绝对看不出来。另一位说,AI 生成的测试用例里,连数学常数和引用的文献链接都是错的,但测试看起来通过了,因为 AI 在「睁眼说瞎话」。

更糟的是质量保证流程的崩塌。代理生成的代码量巨大,99% 的开发者看都不看就点「接受」,因为审查成本太高。结果代码怎么跑的、有没有漏洞,没人真正知道。一位工程师吐槽:「现在我的主要工作从写代码变成了给 AI 擦屁股,而且 AI 犯的错误比人类更诡异,调试起来更反直觉。」

IDE 死了吗?其实宝座还在

作者弃用 IDE 回到 vim 的言论,在技术社区里显得过于激进。不少人反驳:IDE 的代码浏览能力对理解系统至关重要。在命令行里靠运气找上下文是倒退,而在 IDE 里可以高亮函数、精准投喂给代理。更有人预言:IDE 将带着 AI 能力王者归来,目前的 CLI 热只是因为暴露了旧 IDE 的能力不足。

自动补全(autocomplete)反而被认为比完整代理更实用。前者保持「流状态」,后者强制任务切换,还要花一分钟等结果,最后生成一大坨代码,大多数人看都不看就合并。这种工作方式不是在编程,是在玩代币抽奖。

技术真相:卡在中间状态

剥开所有争论,共识是 AI 代理确实变强了,但整个工程体系没跟上。Agent harness(执行框架)的创新被忽视,它负责调用模型和执行工具调用,目前状态简陋得像「九行代码的循环」。真正的问题是失败恢复:当代理点错按钮、遇到验证码或页面渲染异常时,现有框架只会盲目重试。未来的突破在于结构化状态检查点,让代理能回滚到上一个已知良好状态,而不是从头再来。

更有趣的是,很多资深工程师发现,所谓「10 倍效率提升」其实发生在清除技术债务、写内部工具这类「脏活累活」上。核心产品开发仍然需要大量人工协调。就像一位评论者说的:「你可以锯得更快,但木材供应和市政审批才是瓶颈。整个工地的布局都错了。」

经济学的诅咒

这场讨论暴露了一个根本矛盾:技术进步的速度,与人类社会消化变革的速度严重不匹配。农业工业化用了百年,让农民从 40% 降到 1% 的劳动力,但伴随的是明确的社会收益——大家不用为了吃饭而种地。软件行业的效率提升,却可能让大量中产阶级直接掉进经济不安全的深渊,没有配套的社会缓冲机制。

一位开发者算了个账:AI 生成的代码再多,也解决不了需求评审、架构设计、利益相关者沟通这些环节。而这些恰恰决定了一个软件有没有价值。另一位指出,过去三年 Steam 发布的游戏数量从 2023 到 2024 跃升了 5000 款,但 2024 到 2025 又停滞了——说明即使有 AI,找到受众、完成商业闭环依然是最大难关。

最后,最有力的批评指向作者的傲慢:「水本身不是湿的,它让别的东西变湿。」 这种咬文嚼字的技术正确,恰恰暴露了他对反对论点的不理解。反 LLM 的声音不是「反对电动工具」的浪漫主义,而是涵盖环境成本(烧煤发电让程序员「开心」)、知识产权盗窃、训练数据合法性、以及系统失控风险的综合担忧。

这场讨论没有赢家。它提醒我们:AI 代理确实改变了编程,但改变的方向不是简单的『效率提升』,而是让整个行业进入一个调试成本更高、经济更不稳定、质量更不可测的中间态。 在这个状态下,有人提前离场回到 vim,有人烧着代币赌一个不确定的未来,更多人则在困惑:我的下一份工作,究竟是教 AI 写代码,还是给 AI 写的代码擦屁股?

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐