打开书页上的 Agent 设计文章封面

明天,你要和一个做了十年的老手,一起向领导汇报一个方案。

你刚入职三个月。他在这个行业摸爬滚打了十年,见过这个项目类似的坑,也见过它成功的样子。你没有。

你们站在同一个起跑线上吗?


他的十年,是他的预训练

如果把他的大脑想象成一个模型,那十年的经验就是他的预训练数据。他见过的失败案例,走过的弯路,那些"当时我们以为这样就行了,结果……"的时刻——这些经历都已经内化成了他判断问题的直觉。

你没有这些。

但这不代表你明天的汇报一定比他差。

经验是预训练,但预训练不是全部。同样是一个大模型,如果你给它的信息是错的、是残缺的、是毫无结构的,它照样输出烂东西。一个小模型,如果你给它准备了精准的材料,给了它清晰的思考框架,它可以拿出让人意外的结果。

所以今晚,你决定做两件事。

但在开始之前,你先停下来想了一个问题。


你先想清楚:领导想用这个汇报做什么决定

这个问题很容易被跳过。大多数人直接开始准备材料,做 PPT,然后在会议室里才发现讲的东西和领导关心的不在同一个频道。

你对这位领导有一些了解:他做决策的时候,最在意的是执行风险,不是方案有多完美。他见过太多听起来很好但落地就散的东西,所以他需要的不是"这个方向是对的",而是"这个方向我们能不能真的做成"。

这一个判断,改变了你接下来所有的准备。

你调研的方向变了——不只是找"成功案例",更要找"为什么类似项目会在执行阶段死掉"。你的汇报结构也变了——最后的落点不是"这个方案有多好",而是"这个方案的风险点在哪里,我们怎么控制"。

这件事说起来简单,但它是整个准备工作的起点:你需要先想清楚输出给谁看、他需要用它做什么判断,才知道自己该准备什么、怎么编排。

设计 Agent 的时候也是一样的逻辑。你在开口之前,可以先问自己:我需要 Agent 给我一个什么形式的输出?我拿到这个输出之后要用它做什么?是直接发给别人,还是帮我做下一步的判断?这个问题的答案,决定了你该给它什么上下文,该用什么结构引导它。

先问输出要服务什么判断的决策地图


你开始做的第一件事:把该调研的都调研一遍

你不能拥有他的十年,但你可以在今晚把这个方案相关的材料装进脑子里。

你找了过去三个类似项目的复盘报告,看失败在哪里。你找到了一个客户访谈的录音,听他们真实的痛点是什么,不是二手转述的版本。你找了两个业内已经落地的案例,拆解他们是怎么做的,效果如何。

这不是临时抱佛脚。这是在给自己建立这个问题的上下文。

在 AI 的语境里,这件事叫 Context Engineering:你喂进去什么材料,就决定了它从什么地方出发来思考。知识、场景、案例——这三类材料加在一起,构成了一次有效对话的地基。

你今晚做的事情,就是在给明天的自己做 Context Engineering。

你发现一件有意思的事:那个做了十年的老手,他的优势有很大一部分,就是脑子里装着大量你没有的"案例库"。而你今晚花三个小时做的调研,某种程度上在压缩这个差距。

复盘访谈案例组成上下文地基


你做的第二件事:把汇报的逻辑写下来

材料有了,但你不打算直接开始做 PPT。

你先把汇报的逻辑写下来:先讲什么,再讲什么,在哪里引出问题,在哪里给方案,预判领导可能问什么,在哪个环节提前回答。

你给自己定了一个思路:先让对方感受到问题的真实性,再引出方案,最后聚焦在两个关键决策点上,不铺陈太多枝节。

这个过程,你在做的不只是写提纲。你在编排自己的思考流程——让思维按照一个有逻辑的顺序运转,而不是想到哪说到哪。

AI 里管这件事叫 Harness Engineering。

你可以想一想:上次你用 AI 做一个稍微复杂的任务——写一份分析、生成一个方案、帮你拆解一个问题——你是怎么开口的?是直接把问题甩过去,还是先告诉它要按什么顺序来处理?

如果是前者,你大概率得到的是一个"感觉说了很多,但不知道能不能用"的回答。

试着换一种方式:在真正问问题之前,先把你自己的处理逻辑写出来,哪怕只是三行字——“先分析问题背景,再提出两个方向,最后给出我的判断标准”。然后把这三行字告诉 AI,让它按这个顺序走。

你会发现输出质量有明显的变化。不是因为 AI 变聪明了,而是因为你给了它一个可以挂靠的框架。它的"思维"有了编排,不再是从一个模糊的起点随机扩散。

那个做了十年的老手,他的汇报框架是内化的,他不需要写出来,经验帮他自动编排。你的经验还不够,所以你需要显式地把它写出来。

这不是劣势,这是另一种路径——而且这条路径对 AI 同样适用。

三行处理逻辑约束输出路线


你的 PPT 做了六十页

然后你犯了一个错误。

材料调研得太充分了,你舍不得删。复盘报告里有三个有价值的数据,都想放进去。客户访谈的五个痛点,每个都想讲。两个案例,细节都很有意思,也都保留了。

PPT 做完,六十页。

你把它过了一遍,发现一件事:你自己都看不清楚核心论点在哪里了。第十二页的那个关键判断,被前后的材料淹没了,很容易被跳过。后半段几乎是在重复前半段的逻辑,只是换了不同的例子。

这就是上下文腐烂(Context Rot)。

在 AI 里,这是一个真实的现象:当一次对话越来越长,模型能有效处理的信息开始稀释,早期建立的重要背景被后续内容淹没,它开始自相矛盾,开始偏离最初的目标。不是它变笨了,是它的"工作记忆"装不下那么多了,有效信息的密度在下降。

你的六十页 PPT 也在做同一件事:它在稀释听众的注意力。每增加一页可有可无的内容,核心论点的信号就弱一分,噪音就多一分。

你删到了二十二页。那三个数据,留一个最有说服力的;五个痛点,合并成两个维度;两个案例,保留一个最贴的,另一个变成一句话的注脚。

删的过程很痛,但删完之后,逻辑变得非常清晰。

六十页删到二十二页后的信号恢复


你们走进会议室,开始汇报

那个做了十年的老手先讲。他很流畅,很自信,背景信息信手拈来。但你注意到他有几个地方在泛泛而谈,一些判断没有具体材料支撑,更多依赖经验性的断言。

你接着讲。你把昨晚调研的那个客户访谈数据放在开头,直接锚定了问题的真实性。你的逻辑是你昨晚写下来的那条线,一步一步走。最后两个决策点,你把选项和依据都放在了同一页上,让领导一眼能看到你在问什么问题。

会议结束后,领导说了一句话:“你们两个方案各有侧重,但后面这个逻辑更容易让我做判断。”


这时候你就是领导

现在换一个角色。

你不是那个新人了,你是坐在对面听汇报的那个人。两个方案摆在面前,你要拍板。

你会怎么判断?

你不会逐页翻 PPT,你在找的是几个关键信号:这个人理解问题的真实性吗?他的判断有依据还是只有感觉?他知道风险在哪里吗?他给我的选项,是真的在帮我决策,还是在把球踢回给我?

这个判断力,不是靠聪明,是靠对"好的输出长什么样"有清晰的标准。

使用 Agent 的时候,你扮演的就是这个角色。

Agent 给你输出了一段分析、一个方案、一份报告——你怎么知道它做得好不好?你能不能一眼看出它是真的理解了问题,还是在用听起来正确的话填充篇幅?它给的结论有没有具体依据支撑,还是只是把你的问题换了种方式重复了一遍?

这个判断力,和你坐在会议室里听汇报时用的,是同一种能力。

它建立在一件事上:你自己设计过这个 Agent。 你经历过调研的过程,经历过编排逻辑的过程,经历过删材料的痛——你才知道一个好的输出应该长什么样,才能识别 Agent 的输出是真货还是水分。

跳过设计过程直接用 Agent,你会很依赖它,但也很难判断它。你只能看输出顺不顺眼,不知道它哪里对、哪里有问题。

所以使用 Agent 的前提,是你设计过它。设计是新人的工作,使用时你才是领导。


绕了一圈,说的其实是同一件事

你大概已经感觉到了。

这不只是一个汇报技巧的故事。

你今晚做的每一步——调研知识、收集场景、找对比案例;把汇报逻辑显式地写出来;把六十页删到二十二页——这三件事,映射的正是设计 Agent 时最核心的三个概念:Context Engineering、Harness Engineering,以及对上下文腐烂的主动管理。

而你走进会议室之后做的那件事——判断哪个方案更好、能不能落地——就是你设计好 Agent 之后要扮演的角色:对输出有判断力,而不只是看它跑没跑起来。

这个判断力没有捷径,它来自你自己想清楚过这个问题。

理解这件事,比学任何提示词技巧都更根本。因为它问的不是"Agent 怎么设计",而是"你自己是怎么思考的"。

AI 让执行变廉价了,但判断力没有

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐