【Agent智能体9 | 反思设计模式-提示词工程的进阶法则】

本文对比了AI任务处理中直接生成与反思机制的效果差异，探讨了零样本提示与多样本提示的应用场景。实验数据表明，反思机制在各类任务中的表现优于直接生成，尤其在需要高准确度的任务中效果显著。文章通过具体案例（如HTML代码编写、泡茶步骤等）展示了反思提示词的实际应用，并提供了两大实操技巧：明确指示反思动作和提供具体审查标准。这些提示词工程技巧能有效提升AI输出的质量和准确性，帮助解决模型在简单任务上容易

DdigitalNomad

291人浏览 · 2026-05-27 13:06:03

DdigitalNomad · 2026-05-27 13:06:03 发布

声明：本篇博客是以吴恩达的【Agent智能体】教程为基础，并对其中的内容做了笔记整理以及个人收获的总结。

在这里插入图片描述

这篇文章通过对比“直接生成“与“反思机制”的输出结果，以及“零样本”与“多样本”提示词之间的效果差距，为你揭示了为什么 AI 总是容易在简单任务上犯低级错误。而且介绍了反思的应用场景以及实操技巧，帮助你后续进行实操。

直接生成（Direct generation）

在这里插入图片描述

图中，发出指令让它“写一篇关于黑洞的文章”或者“写一段计算复利的 Python 代码”。模型看到指令就直接干活了。

这就是典型的就是零样本提示，这样输出的结果，通常质量不是很高

零样本提示和少量样本提示的对比

在这里插入图片描述

零样本提示 (Zero-shot Prompting)
- 直接给模型下达指令或提问，不提供任何参考示例。模型完全依赖它在训练阶段学到的知识来直接生成回答。
- 让它把日期转换成 MM/DD/YYYY 格式，只给了待转换的变量 {input_date}，没有给任何转换的示范。
单样本提示 (One-shot Prompting)
- 在给出你真正需要处理的任务之前，先给模型提供一个标准的“输入-输出”示例（打一个样）
- 为了确保模型知道你想要的具体格式，你先给了一个例子：Input: Jan 1st, 2025 对应 Output: 01/01/2025。然后再给出你需要它实际处理的 {input_date}。
- 结果：这样能极大提高模型按照你期望的特定格式或语调输出的准确率。
少样本/多样本提示 (Few-shot Prompting)
- 在提示词中提供两个或更多的示例。
- 不仅给了一个例子，还给了第二个例子 Input: 21st June, 2025 对应 Output: 06/21/2025。
- 结果：当任务比较复杂，或者容易产生歧义时，提供多个例子可以帮模型更好地总结出规律（Pattern）

反思为什么有效？（数据证明）

在这里插入图片描述

如图我们可以通过数据看到反思的优势！

核心观点： “Reflection consistently outperforms direct generation on a variety of tasks.”（在各种任务中，反思的表现始终优于直接生成）。

什么任务适合用反思？（应用场景）

在这里插入图片描述

这个图展示了 AI 在“直接生成”时常犯的错，以及如何用“反思提示词”来纠正。

案例拆解：

写 HTML 代码： 经常漏掉 > 符号。反思指令： “验证这段 HTML 代码。”
写泡茶步骤： 可能会跳过某些步骤。反思指令： “检查这些步骤是否连贯且完整。”
起域名： 名字可能很难读，或者有歧义。反思指令： “这个域名有负面含义吗？是不是很难发音？”

结论： 当任务需要高准确度、逻辑严密或涉及主观感受时，AI 的第一反应往往有漏洞，这时候用反思指令去“堵漏”非常管用。

如何写好反思提示词？（实操技巧）

在这里插入图片描述

核心观点： 反思不是简单地对 AI 说“你重写一遍”或“你写得不好”，而是需要提供明确的审查标准。

底部的法则：

Clearly indicate the reflection action (明确指示反思的动作)： 告诉它要“检查”、“审查”或“验证”。
Specify criteria to check (提供具体的检查标准)： 告诉它具体要检查什么。

图中的优秀案例：

起域名时的反思： 不是说“再想几个”，而是说：“检查你刚才建议的域名。看看好不好发音；想一下在其他语言里有没有负面意思；最后只输出符合这些标准的名字。”
改写邮件时的反思： “检查第一版草稿。看看语气够不够专业，有没有可能让人觉得没礼貌的词；核对所有事实、日期和承诺是否准确；然后再写出下一版。”

总结

这些例子很好的展示了在使用大型语言模型时，非常核心的一种提示词工程（Prompt Engineering）技巧：通过提供不同数量的“样本”来引导模型输出。

如果这篇文章对你有帮助，欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

告别手搓 README！我开发了一个 AI 工具，1 分钟生成专业级项目文档

🚀 告别手搓 README！1分钟生成专业文档的AI工具痛点：开发者常花费1-2小时手动编写README，模板复制效果差，缺乏专业性。解决方案：DevReadme AI（橙读AI）——专为Java项目打造的AI驱动README生成器，3秒扫描项目，1分钟输出专业文档。 ✨ 核心功能：自动分析项目结构、技术栈（支持Spring Boot深度检测）智能生成Mermaid架构图（5种图表类型）

2048 AI社区

开发商必看：2026年房地产数字沙盘头部服务商综合实力排行榜

2048 AI社区

Responses协议深度解析：从“聊天”到“干活”的架构革命

当我为了省 Token、保账号，用剪贴板操控 DeepSeek 网页版时，才真正理解了为什么 OpenAI 要彻底抛弃 Chat 协议，也要强推这套有状态的 Responses。故事的起点很荒诞。几个月前，我跟朋友吹牛，说一个月消耗多少 Token 才算“大手子”。朋友晒出的账单是月烧 3 亿 Token，我嘴上说“这不就是随便的事吗”，心里却在盘算：怎么才能让自己的 Token 统计数字也暴涨？