经常调教 AI 智能体的兄弟们,估计都吃过这种苦:

让大模型去跑一个稍微复杂点的长任务,它刚开始干得风生水起,完成了差不多 40%,突然就开启了“自我感动”模式。不是单方面宣布大功告成,就是逻辑彻底跑偏,最后在代码堆里原地躺平。

不过,Anthropic 刚刚推出的 Claude Code 动态工作流(Dynamic Workflows),算是把这个行业顽疾给彻底治住了。

简单一句话总结这次的王炸升级:Claude Code 已经从一个“帮你打工写代码的 AI 助手”,进化成了“能针对复杂脏活儿、现场制定 SOP 的总架构师”。

为什么以前的 AI 总是“干一半就拉胯”?

在过去,我们调教 AI 基本靠“单兵作战”——把所有需求塞进一个长对话(上下文)里,指望一个大模型把规划、写码、测 Bug 的活儿全干了。这种模式在遇到高难度、需要反复验证的复杂工程时,必然会触发三大翻车现场:

AI 式磨洋工: 活儿干到一半,觉得差不多了,直接单方面宣布“搞定”,开始敷衍交差。

盲目自信、当裁判还当运动员: 倾向于信任自己的产出。你让它自己去复查代码,它看一眼就敷衍说“没 Bug,完美”。

目标走失: 随着对话轮次变多,上下文不断被压缩,聊到后面它早把最开始的核心需求忘得一干二净了。

而动态工作流的精髓,就在于“临时拉队伍,组团打群架”。

Claude 不再指望用一个大脑搞定一切。当接到复杂任务时,它会在后台运行一个特制的 JavaScript 脚本,根据任务难度在本地动态搭建起一套“脚手架”。它会像一个项目经理一样,现场招募一堆垂直领域的“子智能体(Subagents)”,把它们丢进彼此隔离的工作区里分头行动。

硬核高玩技巧: 在终端用 Claude Code 时,可以直接吩咐它“创建工作流”,或者直接甩出通关黑话 ultracode,就能一键逼它切换到“架构师”状态。

组团打群架的 6 种标准战术

基于最新 Claude Opus 4.8 的高智商,它现在能根据你的具体需求,现场编写出最适合当前业务的调度逻辑。目前玩得最溜的有以下 6 种套路:

先分类,再分发 :派一个“前台 Agent”先研判任务属性,再精准分流给最擅长该领域的专家。

分布式拆解与合并:把一个大工程切成十几块碎渣,让一堆干净上下文的 Agent 并行处理,最后强力合并。

引入“杠精”质检:专门分出一个 Agent 唱反调,对照着严苛的 Rubric 标准,死磕另一个 Agent 的产出。

海选与过滤 :搞头脑风暴,疯狂输出一堆方案,然后自动去重、筛选、校验,只留独苗。

打擂台/锦标赛机制:针对同一个难题,让好几个 Agent 用不同思路去解,然后两两对决,卷出最优解。

循环直到完美 :开启无限监控模式,不把 Bug 清零、不把漏网之鱼抓干,就绝对不触发停机。

这玩意儿能帮我们解决哪些“脏活累活”?

这种动态编排能力,直接让很多以前大模型根本搞不定的复杂长链路工程,变成了“降维打击”:

抓取玄学 Bug: 比如某个测试跑 50 次才失败 1 次。现在可以让工作流自己在隔离区里不断提出假设、疯狂穷举、反复重试,直到揪出这个幽灵 Bug 为止。

史诗级长文本盲筛: 以前让 AI 筛 1000 份简历,看到第 50 份它就“降智”了。现在用工作流跑“锦标赛两两对决”或“桶排序”,严丝合缝。

大规模代码重构: 比如 Bun 之前尝试把部分底层从 Zig 换到 Rust,就是这套思路——把调用、模块、报错拆成无数细粒度工单,派出一万个分身在隔离工作区里各改各的,最后通过对抗评审强力合并。

避坑指南:好刀怎么用在刃上?

动态工作流确实牛,但也绝对不是万灵药。由于它频繁扇出子智能体、反复搞对抗验证,Token 的消耗速度和网络并发请求量那是呈指数级飙升的。改个前端小样式、写个几行的单体脚本,真没必要派 5 个 AI 审计员去围观它,那是妥妥的算力浪费。

想要在生产环境玩得转,有两条掏心窝子的建议:

1.死死抠住算力预算: 每次发号施令,记得在 Prompt 里加上硬性限制,比如“此任务总预算 10k token,超支自动熔断”。

2.底层算力保障要稳: 这种高并发、多 Agent 频繁调用 API 且伴随着本地大量临时工作区读写的场景,对网络吞吐和延迟要求极高。如果你的本地开发环境网络经常抽风、连接超时,动态工作流就会频繁中断,白白烧掉大把 Token。有深度调试需求的朋友,建议把开发环境直接部署在Hostease的服务器上,在高并发的 Agent 混战中,能极大降低多线程请求的延迟与超时率,完美发挥出动态工作流的全部威力。

结语

Claude Code 的这次大动作,其实指明了 AI 应用开发的新风向:我们正在从“字斟句酌地调优 Prompt”,变成“运筹帷幄地设计组织架构”。

当 AI 开始学会自己搭脚手架,学会了自我怀疑、拉帮结派和控制算力成本,一个“全自动个人软件工厂”的时代,可能真的就在眼前了。

各位看官怎么看?这种让 AI 自己内卷的机制,能帮你解决目前手里最头疼的哪条业务线?欢迎在评论区聊聊!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐