必学!大模型Agent规划模式详解:让AI从“不知道怎么做“到“主动规划“(建议收藏)
本文详解AI Agent规划模式,解决Agent不知道"怎么做"的问题。通过任务分解和动态调整,让Agent自主将复杂目标拆解为可执行步骤序列,实现"先规划后执行"。文章阐述四大要素、与其他模式区别、实战实现(CrewAI/OpenAI API)、应用场景及工程化实践。掌握此模式能让AI从"被动响应"升级为"主动规划",显著提升自主能力和适应性。
当 Agent 不知道“怎么做”时,会发生什么?
如果你已经用提示链、路由、并行化、反思把 Agent 工作流搭得有模有样,接下来可能会遇到这个场景:
- • 用户说“帮我组织一次团队团建活动”,Agent 一脸懵:从哪开始?要做什么?先做什么后做什么?
- • 老板要求“做一份竞品分析报告”,Agent 知道要分析,但不知道应该先收集信息、再对比分析、最后总结,还是反过来?
- • 客户支持遇到复杂问题,Agent 能识别问题,但不知道应该先诊断、再测试、最后升级,还是直接转人工?
这时候你可能会想:能不能让 Agent 自己先想清楚“怎么做”,再开始执行?
这就是本期要聊的规划模式(Planning Pattern)——让 Agent 学会“先规划后执行”,把复杂目标拆解成可执行的步骤序列,从“被动响应”升级到“主动规划”。
一、为什么需要规划?从“知道做什么”到“知道怎么做”
在之前的几期里,我们聊过提示链、路由、并行化、反思,它们解决的都是“如何组织执行流程”的问题。但有一个前提一直没解决:Agent 得先知道“怎么做”,才能开始执行。
用户需求“组织团队团建”
Agent 知道要做什么
但不知道怎么做
要么卡住 / 要么乱做
现实中的痛点很常见:
-
- 目标太抽象:用户说“做个竞品分析”,但 Agent 不知道应该先收集信息、再对比分析、最后总结
-
- 步骤不明确:任务需要多个步骤,但 Agent 不知道先做什么、后做什么、哪些可以并行
-
- 依赖关系混乱:有些步骤必须等前一步完成,但 Agent 不知道这些依赖关系
-
- 动态调整困难:执行过程中遇到问题,Agent 不知道如何调整计划
传统的解决方案是:人工制定详细流程 + 硬编码到 Agent。但这样既死板又难维护,而且每个新任务都要重新设计。
规划模式要做的,就是把这个“人工规划”的过程自动化:
是
否
用户需求“组织团队团建”
规划 Agent分解目标
生成执行计划步骤1 → 步骤2 → 步骤3
执行 Agent按计划执行
遇到问题?
动态调整计划
完成目标
核心思想:不是让 Agent 直接执行复杂任务,而是让它先规划 → 再执行 → 遇到问题动态调整,直到目标达成。
二、规划模式到底在做什么?
一句话概括:规划模式就是让 Agent 把复杂目标拆解成可执行的步骤序列,并动态调整执行策略的能力。
从工程视角看,规划至少包含四个要素:
-
- 目标理解:理解用户想要什么(what),以及约束条件(预算、时间、资源等)
-
- 任务分解:把复杂目标拆解成更小、可管理的子任务
-
- 步骤排序:确定子任务的执行顺序和依赖关系
-
- 动态调整:根据执行结果和新信息,调整后续计划
一个典型的规划流程大概是这样:
Tools/APIs
Executor Agent
Planner Agent
User
Tools/APIs
Executor Agent
Planner Agent
User
alt
[需要调整计划]
loop
[执行每个步骤]
复杂目标(如"组织团队团建")
理解目标和约束
分解成子任务
确定执行顺序
展示计划(可选)
执行计划
调用工具/API
返回结果
评估结果
请求调整
重新规划
更新计划
返回最终结果
在原书的 21 个模式里,规划模式是很多高级模式的基础:多智能体协作需要规划来分配任务,工具使用模式需要规划来决定调用顺序,甚至反思模式也需要规划来组织评估流程。
三、规划 vs 提示链 vs 反思:什么时候用哪个?
这三个模式经常被混淆,但它们解决的是不同层面的问题:
| 模式 | 解决的问题 | 适用场景 | 关键区别 |
|---|---|---|---|
| 提示链 | 如何把复杂任务拆成固定步骤 | 步骤顺序已知、流程相对固定 | 流程是预先设计好的 |
| 规划 | 如何发现“怎么做”的方案 | 步骤顺序未知、需要探索 | 流程是动态生成的 |
| 反思 | 如何提升输出质量 | 输出质量不稳定、需要迭代优化 | 关注质量改进而非流程设计 |
举个具体例子:
- • 提示链:你明确知道“提取信息 → 结构化整理 → 生成报告”这个流程,用提示链把三个步骤串起来
- • 规划:你不知道“组织团队团建”应该怎么做,让 Agent 先规划出“确定预算 → 选择地点 → 预订场地 → 安排交通 → 发送通知”这个流程
- • 反思:Agent 已经生成了报告,但质量不够好,用反思模式让它自己检查并优化
经验法则:
- • 如果“怎么做”已经很清楚 → 用提示链
- • 如果“怎么做”需要探索 → 用规划
- • 如果输出质量需要提升 → 用反思
当然,这三个模式可以组合使用:规划生成流程 → 提示链执行步骤 → 反思优化输出。
四、规划模式的核心机制:从目标到行动
规划模式最核心的能力是任务分解(Task Decomposition)和动态调整(Dynamic Adaptation)。
1. 任务分解:把大象装进冰箱需要几步?
任务分解就是把复杂目标拆解成可执行的子任务。这个过程通常包括:
- • 识别关键步骤:完成目标需要哪些主要步骤?
- • 确定依赖关系:哪些步骤必须先完成,哪些可以并行?
- • 评估资源需求:每个步骤需要什么工具、数据、权限?
复杂目标“组织团队团建”
任务分解
确定预算和人数
选择地点和时间
预订场地和餐饮
安排交通
发送通知
2. 动态调整:计划赶不上变化怎么办?
规划不是一次性的,而是持续的过程。当执行过程中遇到问题,Agent 需要能够调整计划:
- • 检测异常:执行结果不符合预期、遇到错误、资源不可用
- • 重新评估:分析当前状态,确定是否需要调整计划
- • 生成新计划:基于新信息,生成调整后的执行步骤
是
否
执行步骤1
结果符合预期?
继续执行步骤2
分析问题
调整计划
重新执行或跳过
完成目标
这种动态调整能力,让规划模式区别于固定的工作流:它不是“按剧本演戏”,而是“边演边改剧本”。
五、实战代码:CrewAI 实现
CrewAI 通过 Agent 和 Task 的组合,可以很直观地实现规划模式。下面是一个“先规划后写作”的示例:
import osfrom dotenv import load_dotenvfrom crewai import Agent, Task, Crew, Processfrom langchain_openai import ChatOpenAI# 安装依赖# pip install crewai langchain-openai python-dotenv# 从 .env 文件加载环境变量(如 OPENAI_API_KEY)load_dotenv()# 检查 API 密钥是否设置if not os.getenv("OPENAI_API_KEY"): raise ValueError("OPENAI_API_KEY not found in .env file. Please add it.")# 明确指定使用的模型llm = ChatOpenAI(model="gpt-4-turbo", temperature=0.1)# 定义一个具备规划能力的智能体# 它的角色是"规划者+写作者",先制定计划,再执行写作planner_writer_agent = Agent( role='Article Planner and Writer', goal='Plan and then write a concise, engaging summary on a specified topic.', backstory=( 'You are an expert technical writer and content strategist. ' 'Your strength lies in creating a clear, actionable plan before writing, ' 'ensuring the final summary is both informative and easy to digest.' ), verbose=True, # 显示执行过程,方便观察规划过程 allow_delegation=False, # 这个任务不需要委托给其他 Agent llm=llm)# 定义一个需要规划的任务# 注意:任务描述明确要求"先规划,再执行"topic = "The importance of Reinforcement Learning in AI"high_level_task = Task( description=( f"1. Create a bullet-point plan for a summary on the topic: '{topic}'.\n" f"2. Write the summary based on your plan, keeping it around 200 words." ), expected_output=( "A final report containing two distinct sections:\n\n" "### Plan\n" "- A bulleted list outlining the main points of the summary.\n\n" "### Summary\n" "- A concise and well-structured summary of the topic." ), agent=planner_writer_agent,)# 创建 Crew 实例,使用顺序执行流程crew = Crew( agents=[planner_writer_agent], tasks=[high_level_task], process=Process.sequential, # 顺序执行,确保先规划后写作)# 执行任务print("## Running the planning and writing task ##")result = crew.kickoff()print("\n\n---\n## Task Result ##\n---")print(result)
关键设计点:
-
- 任务描述明确要求规划:通过
description明确要求 Agent 先创建计划,再执行写作
- 任务描述明确要求规划:通过
-
- 输出格式结构化:通过
expected_output定义输出格式,确保规划结果和最终输出分离
- 输出格式结构化:通过
-
- 顺序执行保证:使用
Process.sequential确保先规划后执行
- 顺序执行保证:使用
-
- verbose 模式:开启
verbose=True可以观察 Agent 的规划过程,方便调试
- verbose 模式:开启
这个例子展示了规划模式的核心:不是直接执行任务,而是先规划,再按计划执行。
六、实战代码:OpenAI Deep Research API
OpenAI 的 Deep Research API 是规划模式的一个高级应用:它能够自主规划研究流程,动态调整搜索策略,最终生成结构化的研究报告。
from openai import OpenAI# 使用你的 API 密钥初始化 OpenAI 客户端client = OpenAI(api_key="YOUR_OPENAI_API_KEY")# 定义智能体的角色和研究问题system_message = """You are a professional researcher preparing a structured, data-driven report.Focus on data-rich insights, use reliable sources, and include inline citations."""user_query = "Research the economic impact of semaglutide on global healthcare systems."# 调用深度研究 API# 注意:这里只需要提供目标和约束,不需要指定具体的研究步骤response = client.responses.create( model="o3-deep-research-2025-06-26", # 使用深度研究专用模型 input=[ { "role": "developer", "content": [{"type": "input_text", "text": system_message}] }, { "role": "user", "content": [{"type": "input_text", "text": user_query}] } ], reasoning={"summary": "auto"}, # 自动生成推理摘要,可以看到规划过程 tools=[{"type": "web_search_preview"}] # 提供网络搜索工具)# 访问最终报告final_report = response.output[-1].content[0].textprint(final_report)# 访问内联引用和元数据print("\n--- CITATIONS ---")annotations = response.output[-1].content[0].annotationsif annotations: for i, citation in enumerate(annotations): cited_text = final_report[citation.start_index:citation.end_index] print(f"Citation {i+1}:") print(f" Cited Text: {cited_text}") print(f" Title: {citation.title}") print(f" URL: {citation.url}")# 检查中间步骤(可以看到规划过程)print("\n--- INTERMEDIATE STEPS ---")# 1. 推理步骤:模型生成的内部计划和总结try: reasoning_step = next(item for item in response.output if item.type == "reasoning") print("\n[Found a Reasoning Step - 这是规划过程]") for summary_part in reasoning_step.summary: print(f" - {summary_part.text}")except StopIteration: print("\nNo reasoning steps found.")# 2. 网络搜索调用:智能体执行的具体搜索操作try: search_step = next(item for item in response.output if item.type == "web_search_call") print("\n[Found a Web Search Call - 这是执行步骤]") print(f" Query Executed: '{search_step.action['query']}'") print(f" Status: {search_step.status}")except StopIteration: print("\nNo web search steps found.")
Deep Research API 的规划能力:
-
- 自主规划研究流程:模型会根据研究问题,自动规划搜索策略、信息收集顺序、分析步骤
-
- 动态调整搜索策略:根据初步搜索结果,调整后续搜索方向,填补知识空白
-
- 结构化输出:最终生成带有引用的结构化报告,而不是简单的信息堆砌
这个例子展示了规划模式的高级应用:不仅规划执行步骤,还规划信息收集策略,并根据中间结果动态调整。
七、规划模式的应用场景
规划模式特别适合以下场景:
1. 复杂任务自动化
场景:新员工入职、项目启动、业务流程编排
规划流程:
- • 理解任务目标和约束(预算、时间、资源)
- • 分解成子任务(创建账户、分配培训、部门协调)
- • 确定执行顺序和依赖关系
- • 动态调整(如果某个步骤失败,调整后续计划)
收益:自动化复杂流程,减少人工干预,提高执行效率
2. 研究和信息整合
场景:竞品分析、市场调研、学术文献综述
规划流程:
- • 理解研究目标和范围
- • 规划信息收集策略(搜索关键词、数据源、分析方法)
- • 动态调整搜索方向(根据初步结果,填补知识空白)
- • 整合信息生成结构化报告
收益:系统化收集信息,减少遗漏,提高研究质量
3. 问题诊断和解决
场景:技术支持、故障排查、医疗诊断
规划流程:
- • 理解问题描述和症状
- • 规划诊断步骤(先检查什么、再测试什么)
- • 根据诊断结果,规划解决方案
- • 动态调整(如果方案无效,尝试其他方案)
收益:系统化解决问题,减少试错成本,提高解决效率
4. 内容创作和报告生成
场景:技术文档、研究报告、营销方案
规划流程:
- • 理解内容目标和受众
- • 规划内容结构(章节、要点、逻辑顺序)
- • 规划信息收集和整理步骤
- • 按计划生成内容
收益:内容结构更清晰,逻辑更严密,质量更稳定
八、成本与收益的权衡
规划模式虽然能显著提升 Agent 的自主能力,但也要付出代价:
成本
-
- 延迟增加:规划本身需要额外的 LLM 调用,总延迟 = 规划时间 + 执行时间
-
- 成本上升:规划过程需要额外的 token 消耗,成本 = 规划成本 + 执行成本
-
- 不确定性:动态规划可能产生不可预测的执行路径,难以提前估算成本和时间
-
- 调试困难:规划过程是动态的,难以复现和调试
收益
-
- 自主能力提升:Agent 能够处理更复杂的任务,减少人工干预
-
- 适应性增强:能够根据实际情况动态调整,提高成功率
-
- 可扩展性:不需要为每个新任务硬编码流程,更容易扩展
-
- 用户体验:用户只需要描述目标,不需要设计详细流程
何时使用规划模式?
适合使用的场景:
- • 任务复杂度高,步骤顺序不明确
- • 需要根据中间结果动态调整策略
- • 用户只提供目标,不提供执行方案
- • 任务需要探索和试错
不适合使用的场景:
- • 任务流程已经很清楚,不需要探索
- • 对延迟和成本敏感
- • 需要严格的可预测性和可复现性
- • 任务简单,一次性执行即可完成
经验法则:当“怎么做”需要探索,而不是预先知道时,使用规划模式。
九、与其他模式的结合
规划模式可以和其他模式组合使用,形成更强大的系统:
1. 规划 + 提示链
规划生成执行步骤,提示链执行每个步骤:
用户目标
规划:生成步骤序列
提示链:执行步骤1
提示链:执行步骤2
提示链:执行步骤3
完成目标
2. 规划 + 路由
规划决定整体策略,路由选择具体执行路径:
路径A
路径B
用户目标
规划:确定整体策略
路由:选择执行路径
Agent A
Agent B
完成目标
3. 规划 + 反思
规划生成执行步骤,反思优化每个步骤的输出:
用户目标
规划:生成步骤序列
执行步骤1
反思:优化输出
执行步骤2
反思:优化输出
完成目标
4. 规划 + 工具使用
规划决定工具调用顺序,工具使用执行具体操作:
用户目标
规划:确定工具调用顺序
工具使用:调用工具1
工具使用:调用工具2
工具使用:调用工具3
完成目标
十、工程化最佳实践
-
- 明确规划边界:不是所有任务都需要规划,简单任务直接执行即可
-
- 设置规划约束:限制规划深度、步骤数量、执行时间,避免过度规划
-
- 规划结果验证:在执行前验证规划结果的合理性,避免执行无效计划
-
- 动态调整机制:建立完善的异常检测和计划调整机制
-
- 成本监控:记录规划过程的 token 消耗,设置预算上限
-
- 可观测性:记录规划过程、执行步骤、调整原因,方便调试和优化
-
- 用户参与:对于重要任务,可以让用户审阅和修改规划结果
-
- 降级策略:如果规划失败,要有降级到固定流程的备选方案
十一、核心要点总结
规划模式的本质:通过任务分解和动态调整,让 Agent 能够自主发现“怎么做”的方案,从“被动执行”升级到“主动规划”。
适用场景:
- • 复杂任务自动化
- • 研究和信息整合
- • 问题诊断和解决
- • 内容创作和报告生成
关键成功因素:
-
- 明确的目标理解:准确理解用户想要什么,以及约束条件
-
- 有效的任务分解:把复杂目标拆解成可执行的子任务
-
- 合理的步骤排序:确定子任务的执行顺序和依赖关系
-
- 灵活的动态调整:根据执行结果和新信息,调整后续计划
权衡考虑:
- • ✅ 自主能力显著提升
- • ✅ 适应性增强
- • ❌ 延迟和成本增加
- • ❌ 不确定性增加
- • ⚖️ 根据场景权衡使用
十二、看完这一期,可以做点什么?
-
- 识别需要规划的场景:列出你现有 Agent 中“不知道怎么做”的场景
-
- 设计规划流程:确定任务分解策略、步骤排序规则、动态调整机制
-
- 实现一个简单的规划 Agent:从 CrewAI 示例开始,逐步增加复杂度
-
- 监控规划效果:记录规划时间、执行时间、成功率、成本
-
- 优化规划策略:根据实际效果调整规划深度、步骤数量、调整机制
把这个能力加上之后,你的 Agent 才算真正具备了“项目经理”的思维。
普通人如何抓住AI大模型的风口?
领取方式在文末
为什么要学习大模型?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
最后
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
大模型全套学习资料展示
自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!
01 教学内容

-
从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!
-
大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
02适学人群
应届毕业生: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。

vx扫描下方二维码即可
本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
03 入门到进阶学习路线图
大模型学习路线图,整体分为5个大的阶段:
04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
05 行业报告+白皮书合集
收集70+报告与白皮书,了解行业最新动态!
06 90+份面试题/经验
AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限
只展示部分资料
并且还在持续更新中…
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
更多推荐


所有评论(0)