【Agent智能体9 | 反思设计模式-提示词工程的进阶法则】
本文对比了AI任务处理中直接生成与反思机制的效果差异,探讨了零样本提示与多样本提示的应用场景。实验数据表明,反思机制在各类任务中的表现优于直接生成,尤其在需要高准确度的任务中效果显著。文章通过具体案例(如HTML代码编写、泡茶步骤等)展示了反思提示词的实际应用,并提供了两大实操技巧:明确指示反思动作和提供具体审查标准。这些提示词工程技巧能有效提升AI输出的质量和准确性,帮助解决模型在简单任务上容易
声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。

这篇文章通过对比“直接生成“与“反思机制”的输出结果,以及“零样本”与“多样本”提示词之间的效果差距,为你揭示了为什么 AI 总是容易在简单任务上犯低级错误。而且介绍了反思的应用场景以及实操技巧,帮助你后续进行实操。
直接生成(Direct generation)

图中,发出指令让它“写一篇关于黑洞的文章”或者“写一段计算复利的 Python 代码”。模型看到指令就直接干活了。
这就是典型的就是零样本提示,这样输出的结果,通常质量不是很高
零样本提示和少量样本提示的对比

- 零样本提示 (Zero-shot Prompting)
- 直接给模型下达指令或提问,不提供任何参考示例。模型完全依赖它在训练阶段学到的知识来直接生成回答。
- 让它把日期转换成
MM/DD/YYYY格式,只给了待转换的变量{input_date},没有给任何转换的示范。
- 单样本提示 (One-shot Prompting)
- 在给出你真正需要处理的任务之前,先给模型提供一个标准的“输入-输出”示例(打一个样)
- 为了确保模型知道你想要的具体格式,你先给了一个例子:
Input: Jan 1st, 2025对应Output: 01/01/2025。然后再给出你需要它实际处理的{input_date}。 - 结果:这样能极大提高模型按照你期望的特定格式或语调输出的准确率。
- 少样本/多样本提示 (Few-shot Prompting)
- 在提示词中提供两个或更多的示例。
- 不仅给了一个例子,还给了第二个例子
Input: 21st June, 2025对应Output: 06/21/2025。 - 结果:当任务比较复杂,或者容易产生歧义时,提供多个例子可以帮模型更好地总结出规律(Pattern)
反思为什么有效?(数据证明)

如图我们可以通过数据看到反思的优势!
核心观点: “Reflection consistently outperforms direct generation on a variety of tasks.”(在各种任务中,反思的表现始终优于直接生成)。
什么任务适合用反思?(应用场景)

这个图展示了 AI 在“直接生成”时常犯的错,以及如何用“反思提示词”来纠正。
案例拆解:
- 写 HTML 代码: 经常漏掉
>符号。反思指令: “验证这段 HTML 代码。” - 写泡茶步骤: 可能会跳过某些步骤。反思指令: “检查这些步骤是否连贯且完整。”
- 起域名: 名字可能很难读,或者有歧义。反思指令: “这个域名有负面含义吗?是不是很难发音?”
结论: 当任务需要高准确度、逻辑严密或涉及主观感受时,AI 的第一反应往往有漏洞,这时候用反思指令去“堵漏”非常管用。
如何写好反思提示词?(实操技巧)

核心观点: 反思不是简单地对 AI 说“你重写一遍”或“你写得不好”,而是需要提供明确的审查标准。
底部的法则:
- Clearly indicate the reflection action (明确指示反思的动作): 告诉它要“检查”、“审查”或“验证”。
- Specify criteria to check (提供具体的检查标准): 告诉它具体要检查什么。
图中的优秀案例:
- 起域名时的反思: 不是说“再想几个”,而是说:“检查你刚才建议的域名。看看好不好发音;想一下在其他语言里有没有负面意思;最后只输出符合这些标准的名字。”
- 改写邮件时的反思: “检查第一版草稿。看看语气够不够专业,有没有可能让人觉得没礼貌的词;核对所有事实、日期和承诺是否准确;然后再写出下一版。”
总结
这些例子很好的展示了在使用大型语言模型时,非常核心的一种提示词工程(Prompt Engineering)技巧:通过提供不同数量的“样本”来引导模型输出。
如果这篇文章对你有帮助,欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力!
更多推荐

所有评论(0)