必学！大模型Agent规划模式详解：让AI从“不知道怎么做“到“主动规划“（建议收藏）

本文详解AI Agent规划模式，解决Agent不知道"怎么做"的问题。通过任务分解和动态调整，让Agent自主将复杂目标拆解为可执行步骤序列，实现"先规划后执行"。文章阐述四大要素、与其他模式区别、实战实现(CrewAI/OpenAI API)、应用场景及工程化实践。掌握此模式能让AI从"被动响应"升级为"主动规划"，显著提升自主能力和适应性。

AI小白熊

351人浏览 · 2025-11-24 11:00:45

AI小白熊 · 2025-11-24 11:00:45 发布

当 Agent 不知道“怎么做”时，会发生什么？

如果你已经用提示链、路由、并行化、反思把 Agent 工作流搭得有模有样，接下来可能会遇到这个场景：

• 用户说“帮我组织一次团队团建活动”，Agent 一脸懵：从哪开始？要做什么？先做什么后做什么？
• 老板要求“做一份竞品分析报告”，Agent 知道要分析，但不知道应该先收集信息、再对比分析、最后总结，还是反过来？
• 客户支持遇到复杂问题，Agent 能识别问题，但不知道应该先诊断、再测试、最后升级，还是直接转人工？

这时候你可能会想：能不能让 Agent 自己先想清楚“怎么做”，再开始执行？

这就是本期要聊的规划模式（Planning Pattern）——让 Agent 学会“先规划后执行”，把复杂目标拆解成可执行的步骤序列，从“被动响应”升级到“主动规划”。
在这里插入图片描述

一、为什么需要规划？从“知道做什么”到“知道怎么做”

在之前的几期里，我们聊过提示链、路由、并行化、反思，它们解决的都是“如何组织执行流程”的问题。但有一个前提一直没解决：Agent 得先知道“怎么做”，才能开始执行。


用户需求“组织团队团建”
Agent 知道要做什么
但不知道怎么做
要么卡住 / 要么乱做

现实中的痛点很常见：

1. 目标太抽象：用户说“做个竞品分析”，但 Agent 不知道应该先收集信息、再对比分析、最后总结
1. 步骤不明确：任务需要多个步骤，但 Agent 不知道先做什么、后做什么、哪些可以并行
1. 依赖关系混乱：有些步骤必须等前一步完成，但 Agent 不知道这些依赖关系
1. 动态调整困难：执行过程中遇到问题，Agent 不知道如何调整计划

传统的解决方案是：人工制定详细流程 + 硬编码到 Agent。但这样既死板又难维护，而且每个新任务都要重新设计。

规划模式要做的，就是把这个“人工规划”的过程自动化：


是

否
用户需求“组织团队团建”
规划 Agent分解目标
生成执行计划步骤1 → 步骤2 → 步骤3
执行 Agent按计划执行
遇到问题?
动态调整计划
完成目标

核心思想：不是让 Agent 直接执行复杂任务，而是让它先规划 → 再执行 → 遇到问题动态调整，直到目标达成。

二、规划模式到底在做什么？

一句话概括：规划模式就是让 Agent 把复杂目标拆解成可执行的步骤序列，并动态调整执行策略的能力。

从工程视角看，规划至少包含四个要素：

1. 目标理解：理解用户想要什么（what），以及约束条件（预算、时间、资源等）
1. 任务分解：把复杂目标拆解成更小、可管理的子任务
1. 步骤排序：确定子任务的执行顺序和依赖关系
1. 动态调整：根据执行结果和新信息，调整后续计划

一个典型的规划流程大概是这样：

Tools/APIs
Executor Agent
Planner Agent
User
Tools/APIs
Executor Agent
Planner Agent
User
alt
[需要调整计划]
loop
[执行每个步骤]
复杂目标（如"组织团队团建"）
理解目标和约束
分解成子任务
确定执行顺序
展示计划（可选）
执行计划
调用工具/API
返回结果
评估结果
请求调整
重新规划
更新计划
返回最终结果

在原书的 21 个模式里，规划模式是很多高级模式的基础：多智能体协作需要规划来分配任务，工具使用模式需要规划来决定调用顺序，甚至反思模式也需要规划来组织评估流程。

三、规划 vs 提示链 vs 反思：什么时候用哪个？

这三个模式经常被混淆，但它们解决的是不同层面的问题：

模式	解决的问题	适用场景	关键区别
提示链	如何把复杂任务拆成固定步骤	步骤顺序已知、流程相对固定	流程是预先设计好的
规划	如何发现“怎么做”的方案	步骤顺序未知、需要探索	流程是动态生成的
反思	如何提升输出质量	输出质量不稳定、需要迭代优化	关注质量改进而非流程设计

举个具体例子：

• 提示链：你明确知道“提取信息 → 结构化整理 → 生成报告”这个流程，用提示链把三个步骤串起来
• 规划：你不知道“组织团队团建”应该怎么做，让 Agent 先规划出“确定预算 → 选择地点 → 预订场地 → 安排交通 → 发送通知”这个流程
• 反思：Agent 已经生成了报告，但质量不够好，用反思模式让它自己检查并优化

经验法则：

• 如果“怎么做”已经很清楚 → 用提示链
• 如果“怎么做”需要探索 → 用规划
• 如果输出质量需要提升 → 用反思

当然，这三个模式可以组合使用：规划生成流程 → 提示链执行步骤 → 反思优化输出。

四、规划模式的核心机制：从目标到行动

规划模式最核心的能力是任务分解（Task Decomposition）和动态调整（Dynamic Adaptation）。

1. 任务分解：把大象装进冰箱需要几步？

任务分解就是把复杂目标拆解成可执行的子任务。这个过程通常包括：

• 识别关键步骤：完成目标需要哪些主要步骤？
• 确定依赖关系：哪些步骤必须先完成，哪些可以并行？
• 评估资源需求：每个步骤需要什么工具、数据、权限？


复杂目标“组织团队团建”
任务分解
确定预算和人数
选择地点和时间
预订场地和餐饮
安排交通
发送通知

2. 动态调整：计划赶不上变化怎么办？

规划不是一次性的，而是持续的过程。当执行过程中遇到问题，Agent 需要能够调整计划：

• 检测异常：执行结果不符合预期、遇到错误、资源不可用
• 重新评估：分析当前状态，确定是否需要调整计划
• 生成新计划：基于新信息，生成调整后的执行步骤


是
否

执行步骤1
结果符合预期?
继续执行步骤2
分析问题
调整计划
重新执行或跳过
完成目标

这种动态调整能力，让规划模式区别于固定的工作流：它不是“按剧本演戏”，而是“边演边改剧本”。

五、实战代码：CrewAI 实现

CrewAI 通过 Agent 和 Task 的组合，可以很直观地实现规划模式。下面是一个“先规划后写作”的示例：

import osfrom dotenv import load_dotenvfrom crewai import Agent, Task, Crew, Processfrom langchain_openai import ChatOpenAI# 安装依赖# pip install crewai langchain-openai python-dotenv# 从 .env 文件加载环境变量（如 OPENAI_API_KEY）load_dotenv()# 检查 API 密钥是否设置if not os.getenv("OPENAI_API_KEY"):    raise ValueError("OPENAI_API_KEY not found in .env file. Please add it.")# 明确指定使用的模型llm = ChatOpenAI(model="gpt-4-turbo", temperature=0.1)# 定义一个具备规划能力的智能体# 它的角色是"规划者+写作者"，先制定计划，再执行写作planner_writer_agent = Agent(    role='Article Planner and Writer',    goal='Plan and then write a concise, engaging summary on a specified topic.',    backstory=(        'You are an expert technical writer and content strategist. '        'Your strength lies in creating a clear, actionable plan before writing, '        'ensuring the final summary is both informative and easy to digest.'    ),    verbose=True,  # 显示执行过程，方便观察规划过程    allow_delegation=False,  # 这个任务不需要委托给其他 Agent    llm=llm)# 定义一个需要规划的任务# 注意：任务描述明确要求"先规划，再执行"topic = "The importance of Reinforcement Learning in AI"high_level_task = Task(    description=(        f"1. Create a bullet-point plan for a summary on the topic: '{topic}'.\n"        f"2. Write the summary based on your plan, keeping it around 200 words."    ),    expected_output=(        "A final report containing two distinct sections:\n\n"        "### Plan\n"        "- A bulleted list outlining the main points of the summary.\n\n"        "### Summary\n"        "- A concise and well-structured summary of the topic."    ),    agent=planner_writer_agent,)# 创建 Crew 实例，使用顺序执行流程crew = Crew(    agents=[planner_writer_agent],    tasks=[high_level_task],    process=Process.sequential,  # 顺序执行，确保先规划后写作)# 执行任务print("## Running the planning and writing task ##")result = crew.kickoff()print("\n\n---\n## Task Result ##\n---")print(result)

关键设计点：

1. 任务描述明确要求规划：通过 description 明确要求 Agent 先创建计划，再执行写作
1. 输出格式结构化：通过 expected_output 定义输出格式，确保规划结果和最终输出分离
1. 顺序执行保证：使用 Process.sequential 确保先规划后执行
1. verbose 模式：开启 verbose=True 可以观察 Agent 的规划过程，方便调试

这个例子展示了规划模式的核心：不是直接执行任务，而是先规划，再按计划执行。

六、实战代码：OpenAI Deep Research API

OpenAI 的 Deep Research API 是规划模式的一个高级应用：它能够自主规划研究流程，动态调整搜索策略，最终生成结构化的研究报告。

from openai import OpenAI# 使用你的 API 密钥初始化 OpenAI 客户端client = OpenAI(api_key="YOUR_OPENAI_API_KEY")# 定义智能体的角色和研究问题system_message = """You are a professional researcher preparing a structured, data-driven report.Focus on data-rich insights, use reliable sources, and include inline citations."""user_query = "Research the economic impact of semaglutide on global healthcare systems."# 调用深度研究 API# 注意：这里只需要提供目标和约束，不需要指定具体的研究步骤response = client.responses.create(  model="o3-deep-research-2025-06-26",  # 使用深度研究专用模型  input=[    {      "role": "developer",      "content": [{"type": "input_text", "text": system_message}]    },    {      "role": "user",      "content": [{"type": "input_text", "text": user_query}]    }  ],  reasoning={"summary": "auto"},  # 自动生成推理摘要，可以看到规划过程  tools=[{"type": "web_search_preview"}]  # 提供网络搜索工具)# 访问最终报告final_report = response.output[-1].content[0].textprint(final_report)# 访问内联引用和元数据print("\n--- CITATIONS ---")annotations = response.output[-1].content[0].annotationsif annotations:    for i, citation in enumerate(annotations):        cited_text = final_report[citation.start_index:citation.end_index]        print(f"Citation {i+1}:")        print(f"  Cited Text: {cited_text}")        print(f"  Title: {citation.title}")        print(f"  URL: {citation.url}")# 检查中间步骤（可以看到规划过程）print("\n--- INTERMEDIATE STEPS ---")# 1. 推理步骤：模型生成的内部计划和总结try:    reasoning_step = next(item for item in response.output if item.type == "reasoning")    print("\n[Found a Reasoning Step - 这是规划过程]")    for summary_part in reasoning_step.summary:        print(f"  - {summary_part.text}")except StopIteration:    print("\nNo reasoning steps found.")# 2. 网络搜索调用：智能体执行的具体搜索操作try:    search_step = next(item for item in response.output if item.type == "web_search_call")    print("\n[Found a Web Search Call - 这是执行步骤]")    print(f"  Query Executed: '{search_step.action['query']}'")    print(f"  Status: {search_step.status}")except StopIteration:    print("\nNo web search steps found.")

Deep Research API 的规划能力：

1. 自主规划研究流程：模型会根据研究问题，自动规划搜索策略、信息收集顺序、分析步骤
1. 动态调整搜索策略：根据初步搜索结果，调整后续搜索方向，填补知识空白
1. 结构化输出：最终生成带有引用的结构化报告，而不是简单的信息堆砌

这个例子展示了规划模式的高级应用：不仅规划执行步骤，还规划信息收集策略，并根据中间结果动态调整。

七、规划模式的应用场景

规划模式特别适合以下场景：

1. 复杂任务自动化

场景：新员工入职、项目启动、业务流程编排

规划流程：

• 理解任务目标和约束（预算、时间、资源）
• 分解成子任务（创建账户、分配培训、部门协调）
• 确定执行顺序和依赖关系
• 动态调整（如果某个步骤失败，调整后续计划）

收益：自动化复杂流程，减少人工干预，提高执行效率

2. 研究和信息整合

场景：竞品分析、市场调研、学术文献综述

规划流程：

• 理解研究目标和范围
• 规划信息收集策略（搜索关键词、数据源、分析方法）
• 动态调整搜索方向（根据初步结果，填补知识空白）
• 整合信息生成结构化报告

收益：系统化收集信息，减少遗漏，提高研究质量

3. 问题诊断和解决

场景：技术支持、故障排查、医疗诊断

规划流程：

• 理解问题描述和症状
• 规划诊断步骤（先检查什么、再测试什么）
• 根据诊断结果，规划解决方案
• 动态调整（如果方案无效，尝试其他方案）

收益：系统化解决问题，减少试错成本，提高解决效率

4. 内容创作和报告生成

场景：技术文档、研究报告、营销方案

规划流程：

• 理解内容目标和受众
• 规划内容结构（章节、要点、逻辑顺序）
• 规划信息收集和整理步骤
• 按计划生成内容

收益：内容结构更清晰，逻辑更严密，质量更稳定

八、成本与收益的权衡

规划模式虽然能显著提升 Agent 的自主能力，但也要付出代价：

成本

1. 延迟增加：规划本身需要额外的 LLM 调用，总延迟 = 规划时间 + 执行时间
1. 成本上升：规划过程需要额外的 token 消耗，成本 = 规划成本 + 执行成本
1. 不确定性：动态规划可能产生不可预测的执行路径，难以提前估算成本和时间
1. 调试困难：规划过程是动态的，难以复现和调试

收益

1. 自主能力提升：Agent 能够处理更复杂的任务，减少人工干预
1. 适应性增强：能够根据实际情况动态调整，提高成功率
1. 可扩展性：不需要为每个新任务硬编码流程，更容易扩展
1. 用户体验：用户只需要描述目标，不需要设计详细流程

何时使用规划模式？

适合使用的场景：

• 任务复杂度高，步骤顺序不明确
• 需要根据中间结果动态调整策略
• 用户只提供目标，不提供执行方案
• 任务需要探索和试错

不适合使用的场景：

• 任务流程已经很清楚，不需要探索
• 对延迟和成本敏感
• 需要严格的可预测性和可复现性
• 任务简单，一次性执行即可完成

经验法则：当“怎么做”需要探索，而不是预先知道时，使用规划模式。

九、与其他模式的结合

规划模式可以和其他模式组合使用，形成更强大的系统：

1. 规划 + 提示链

规划生成执行步骤，提示链执行每个步骤：


用户目标
规划：生成步骤序列
提示链：执行步骤1
提示链：执行步骤2
提示链：执行步骤3
完成目标

2. 规划 + 路由

规划决定整体策略，路由选择具体执行路径：


路径A
路径B

用户目标
规划：确定整体策略
路由：选择执行路径
Agent A
Agent B
完成目标

3. 规划 + 反思

规划生成执行步骤，反思优化每个步骤的输出：


用户目标
规划：生成步骤序列
执行步骤1
反思：优化输出
执行步骤2
反思：优化输出
完成目标

4. 规划 + 工具使用

规划决定工具调用顺序，工具使用执行具体操作：


用户目标
规划：确定工具调用顺序
工具使用：调用工具1
工具使用：调用工具2
工具使用：调用工具3
完成目标

十、工程化最佳实践

1. 明确规划边界：不是所有任务都需要规划，简单任务直接执行即可
1. 设置规划约束：限制规划深度、步骤数量、执行时间，避免过度规划
1. 规划结果验证：在执行前验证规划结果的合理性，避免执行无效计划
1. 动态调整机制：建立完善的异常检测和计划调整机制
1. 成本监控：记录规划过程的 token 消耗，设置预算上限
1. 可观测性：记录规划过程、执行步骤、调整原因，方便调试和优化
1. 用户参与：对于重要任务，可以让用户审阅和修改规划结果
1. 降级策略：如果规划失败，要有降级到固定流程的备选方案

十一、核心要点总结

规划模式的本质：通过任务分解和动态调整，让 Agent 能够自主发现“怎么做”的方案，从“被动执行”升级到“主动规划”。

适用场景：

• 复杂任务自动化
• 研究和信息整合
• 问题诊断和解决
• 内容创作和报告生成

关键成功因素：

1. 明确的目标理解：准确理解用户想要什么，以及约束条件
1. 有效的任务分解：把复杂目标拆解成可执行的子任务
1. 合理的步骤排序：确定子任务的执行顺序和依赖关系
1. 灵活的动态调整：根据执行结果和新信息，调整后续计划

权衡考虑：

• ✅ 自主能力显著提升
• ✅ 适应性增强
• ❌ 延迟和成本增加
• ❌ 不确定性增加
• ⚖️ 根据场景权衡使用

十二、看完这一期，可以做点什么？

1. 识别需要规划的场景：列出你现有 Agent 中“不知道怎么做”的场景
1. 设计规划流程：确定任务分解策略、步骤排序规则、动态调整机制
1. 实现一个简单的规划 Agent：从 CrewAI 示例开始，逐步增加复杂度
1. 监控规划效果：记录规划时间、执行时间、成功率、成本
1. 优化规划策略：根据实际效果调整规划深度、步骤数量、调整机制

把这个能力加上之后，你的 Agent 才算真正具备了“项目经理”的思维。

普通人如何抓住AI大模型的风口？

领取方式在文末

为什么要学习大模型？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：
在这里插入图片描述

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

最后

只要你真心想学习AI大模型技术，这份精心整理的学习资料我愿意无偿分享给你，但是想学技术去乱搞的人别来找我！

在当前这个人工智能高速发展的时代，AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长，真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料，能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来，我们不断打磨课程体系与技术内容，在细节上精益求精，同时在技术层面也新增了许多前沿且实用的内容，力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径，能够帮助你从零入门，进阶到实战，真正掌握AI时代的核心技能！

01 教学内容

从零到精通完整闭环：【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块，内容比传统教材更贴近企业实战！
大量真实项目案例： 带你亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

02适学人群

应届毕业生‌： 无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌： 非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈： 传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵，仅限大家自行学习，不要传播！更严禁商用！

03 入门到进阶学习路线图

大模型学习路线图，整体分为5个大的阶段：

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程（涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向）

新手必备的大模型学习PDF书单来了！全是硬核知识，帮你少走弯路（不吹牛，真有用）

05 行业报告+白皮书合集

收集70+报告与白皮书，了解行业最新动态！

06 90+份面试题/经验

AI大模型岗位面试经验总结（谁学技术不是为了赚$呢，找个好的岗位很重要）
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Spring AI 可观测性（Observability）技术详解

可观测性（Observability）指系统能够通过外部输出（如日志、指标、跟踪）反映内部状态，便于监控、诊断和优化。Spring Boot 的监控和管理工具包，提供健康检查、指标暴露、应用监控等能力。MicrometerJVM 应用指标收集库，支持多种监控后端（如 Prometheus、Grafana）。开源分布式追踪/指标标准，Spring AI 参考其语义约定。