【收藏】规划模式:解决AI Agent“不知道怎么做“的难题,大模型开发必学!
规划模式让AI Agent学会"先规划后执行",通过任务分解和动态调整将复杂目标拆解为可执行步骤。适用于复杂任务自动化、研究信息整合等场景,可与提示链、反思等模式结合使用,显著提升自主能力和适应性,但会增加延迟和成本。CrewAI和Deep Research API提供了具体实现。
规划模式让AI Agent学会"先规划后执行",通过任务分解和动态调整将复杂目标拆解为可执行步骤。适用于复杂任务自动化、研究信息整合等场景,可与提示链、反思等模式结合使用,显著提升自主能力和适应性,但会增加延迟和成本。CrewAI和Deep Research API提供了具体实现。
当 Agent 不知道“怎么做”时,会发生什么?
如果你已经用提示链、路由、并行化、反思把 Agent 工作流搭得有模有样,接下来可能会遇到这个场景:
- • 用户说“帮我组织一次团队团建活动”,Agent 一脸懵:从哪开始?要做什么?先做什么后做什么?
- • 老板要求“做一份竞品分析报告”,Agent 知道要分析,但不知道应该先收集信息、再对比分析、最后总结,还是反过来?
- • 客户支持遇到复杂问题,Agent 能识别问题,但不知道应该先诊断、再测试、最后升级,还是直接转人工?
这时候你可能会想:能不能让 Agent 自己先想清楚“怎么做”,再开始执行?
这就是本期要聊的规划模式(Planning Pattern)——让 Agent 学会“先规划后执行”,把复杂目标拆解成可执行的步骤序列,从“被动响应”升级到“主动规划”。
一、为什么需要规划?从“知道做什么”到“知道怎么做”
在之前的几期里,我们聊过提示链、路由、并行化、反思,它们解决的都是“如何组织执行流程”的问题。但有一个前提一直没解决:Agent 得先知道“怎么做”,才能开始执行。
用户需求“组织团队团建”
Agent 知道要做什么
但不知道怎么做
要么卡住 / 要么乱做
现实中的痛点很常见:
-
- 目标太抽象:用户说“做个竞品分析”,但 Agent 不知道应该先收集信息、再对比分析、最后总结
-
- 步骤不明确:任务需要多个步骤,但 Agent 不知道先做什么、后做什么、哪些可以并行
-
- 依赖关系混乱:有些步骤必须等前一步完成,但 Agent 不知道这些依赖关系
-
- 动态调整困难:执行过程中遇到问题,Agent 不知道如何调整计划
传统的解决方案是:人工制定详细流程 + 硬编码到 Agent。但这样既死板又难维护,而且每个新任务都要重新设计。
规划模式要做的,就是把这个“人工规划”的过程自动化:
是
否
用户需求“组织团队团建”
规划 Agent分解目标
生成执行计划步骤1 → 步骤2 → 步骤3
执行 Agent按计划执行
遇到问题?
动态调整计划
完成目标
核心思想:不是让 Agent 直接执行复杂任务,而是让它先规划 → 再执行 → 遇到问题动态调整,直到目标达成。
二、规划模式到底在做什么?
一句话概括:规划模式就是让 Agent 把复杂目标拆解成可执行的步骤序列,并动态调整执行策略的能力。
从工程视角看,规划至少包含四个要素:
-
- 目标理解:理解用户想要什么(what),以及约束条件(预算、时间、资源等)
-
- 任务分解:把复杂目标拆解成更小、可管理的子任务
-
- 步骤排序:确定子任务的执行顺序和依赖关系
-
- 动态调整:根据执行结果和新信息,调整后续计划
一个典型的规划流程大概是这样:
Tools/APIs
Executor Agent
Planner Agent
User
Tools/APIs
Executor Agent
Planner Agent
User
alt
[需要调整计划]
loop
[执行每个步骤]
复杂目标(如"组织团队团建")
理解目标和约束
分解成子任务
确定执行顺序
展示计划(可选)
执行计划
调用工具/API
返回结果
评估结果
请求调整
重新规划
更新计划
返回最终结果
在原书的 21 个模式里,规划模式是很多高级模式的基础:多智能体协作需要规划来分配任务,工具使用模式需要规划来决定调用顺序,甚至反思模式也需要规划来组织评估流程。
三、规划 vs 提示链 vs 反思:什么时候用哪个?
这三个模式经常被混淆,但它们解决的是不同层面的问题:
| 模式 | 解决的问题 | 适用场景 | 关键区别 |
|---|---|---|---|
| 提示链 | 如何把复杂任务拆成固定步骤 | 步骤顺序已知、流程相对固定 | 流程是预先设计好的 |
| 规划 | 如何发现“怎么做”的方案 | 步骤顺序未知、需要探索 | 流程是动态生成的 |
| 反思 | 如何提升输出质量 | 输出质量不稳定、需要迭代优化 | 关注质量改进而非流程设计 |
举个具体例子:
- • 提示链:你明确知道“提取信息 → 结构化整理 → 生成报告”这个流程,用提示链把三个步骤串起来
- • 规划:你不知道“组织团队团建”应该怎么做,让 Agent 先规划出“确定预算 → 选择地点 → 预订场地 → 安排交通 → 发送通知”这个流程
- • 反思:Agent 已经生成了报告,但质量不够好,用反思模式让它自己检查并优化
经验法则:
- • 如果“怎么做”已经很清楚 → 用提示链
- • 如果“怎么做”需要探索 → 用规划
- • 如果输出质量需要提升 → 用反思
当然,这三个模式可以组合使用:规划生成流程 → 提示链执行步骤 → 反思优化输出。
四、规划模式的核心机制:从目标到行动
规划模式最核心的能力是任务分解(Task Decomposition)和动态调整(Dynamic Adaptation)。
1. 任务分解:把大象装进冰箱需要几步?
任务分解就是把复杂目标拆解成可执行的子任务。这个过程通常包括:
- • 识别关键步骤:完成目标需要哪些主要步骤?
- • 确定依赖关系:哪些步骤必须先完成,哪些可以并行?
- • 评估资源需求:每个步骤需要什么工具、数据、权限?
复杂目标“组织团队团建”
任务分解
确定预算和人数
选择地点和时间
预订场地和餐饮
安排交通
发送通知
2. 动态调整:计划赶不上变化怎么办?
规划不是一次性的,而是持续的过程。当执行过程中遇到问题,Agent 需要能够调整计划:
- • 检测异常:执行结果不符合预期、遇到错误、资源不可用
- • 重新评估:分析当前状态,确定是否需要调整计划
- • 生成新计划:基于新信息,生成调整后的执行步骤
是
否
执行步骤1
结果符合预期?
继续执行步骤2
分析问题
调整计划
重新执行或跳过
完成目标
这种动态调整能力,让规划模式区别于固定的工作流:它不是“按剧本演戏”,而是“边演边改剧本”。
五、实战代码:CrewAI 实现
CrewAI 通过 Agent 和 Task 的组合,可以很直观地实现规划模式。下面是一个“先规划后写作”的示例:
import osfrom dotenv import load_dotenvfrom crewai import Agent, Task, Crew, Processfrom langchain_openai import ChatOpenAI# 安装依赖# pip install crewai langchain-openai python-dotenv# 从 .env 文件加载环境变量(如 OPENAI_API_KEY)load_dotenv()# 检查 API 密钥是否设置if not os.getenv("OPENAI_API_KEY"): raise ValueError("OPENAI_API_KEY not found in .env file. Please add it.")# 明确指定使用的模型llm = ChatOpenAI(model="gpt-4-turbo", temperature=0.1)# 定义一个具备规划能力的智能体# 它的角色是"规划者+写作者",先制定计划,再执行写作planner_writer_agent = Agent( role='Article Planner and Writer', goal='Plan and then write a concise, engaging summary on a specified topic.', backstory=( 'You are an expert technical writer and content strategist. ' 'Your strength lies in creating a clear, actionable plan before writing, ' 'ensuring the final summary is both informative and easy to digest.' ), verbose=True, # 显示执行过程,方便观察规划过程 allow_delegation=False, # 这个任务不需要委托给其他 Agent llm=llm)# 定义一个需要规划的任务# 注意:任务描述明确要求"先规划,再执行"topic = "The importance of Reinforcement Learning in AI"high_level_task = Task( description=( f"1. Create a bullet-point plan for a summary on the topic: '{topic}'.\n" f"2. Write the summary based on your plan, keeping it around 200 words." ), expected_output=( "A final report containing two distinct sections:\n\n" "### Plan\n" "- A bulleted list outlining the main points of the summary.\n\n" "### Summary\n" "- A concise and well-structured summary of the topic." ), agent=planner_writer_agent,)# 创建 Crew 实例,使用顺序执行流程crew = Crew( agents=[planner_writer_agent], tasks=[high_level_task], process=Process.sequential, # 顺序执行,确保先规划后写作)# 执行任务print("## Running the planning and writing task ##")result = crew.kickoff()print("\n\n---\n## Task Result ##\n---")print(result)
关键设计点:
-
- 任务描述明确要求规划:通过
description明确要求 Agent 先创建计划,再执行写作
- 任务描述明确要求规划:通过
-
- 输出格式结构化:通过
expected_output定义输出格式,确保规划结果和最终输出分离
- 输出格式结构化:通过
-
- 顺序执行保证:使用
Process.sequential确保先规划后执行
- 顺序执行保证:使用
-
- verbose 模式:开启
verbose=True可以观察 Agent 的规划过程,方便调试
- verbose 模式:开启
这个例子展示了规划模式的核心:不是直接执行任务,而是先规划,再按计划执行。
六、实战代码:OpenAI Deep Research API
OpenAI 的 Deep Research API 是规划模式的一个高级应用:它能够自主规划研究流程,动态调整搜索策略,最终生成结构化的研究报告。
from openai import OpenAI# 使用你的 API 密钥初始化 OpenAI 客户端client = OpenAI(api_key="YOUR_OPENAI_API_KEY")# 定义智能体的角色和研究问题system_message = """You are a professional researcher preparing a structured, data-driven report.Focus on data-rich insights, use reliable sources, and include inline citations."""user_query = "Research the economic impact of semaglutide on global healthcare systems."# 调用深度研究 API# 注意:这里只需要提供目标和约束,不需要指定具体的研究步骤response = client.responses.create( model="o3-deep-research-2025-06-26", # 使用深度研究专用模型 input=[ { "role": "developer", "content": [{"type": "input_text", "text": system_message}] }, { "role": "user", "content": [{"type": "input_text", "text": user_query}] } ], reasoning={"summary": "auto"}, # 自动生成推理摘要,可以看到规划过程 tools=[{"type": "web_search_preview"}] # 提供网络搜索工具)# 访问最终报告final_report = response.output[-1].content[0].textprint(final_report)# 访问内联引用和元数据print("\n--- CITATIONS ---")annotations = response.output[-1].content[0].annotationsif annotations: for i, citation in enumerate(annotations): cited_text = final_report[citation.start_index:citation.end_index] print(f"Citation {i+1}:") print(f" Cited Text: {cited_text}") print(f" Title: {citation.title}") print(f" URL: {citation.url}")# 检查中间步骤(可以看到规划过程)print("\n--- INTERMEDIATE STEPS ---")# 1. 推理步骤:模型生成的内部计划和总结try: reasoning_step = next(item for item in response.output if item.type == "reasoning") print("\n[Found a Reasoning Step - 这是规划过程]") for summary_part in reasoning_step.summary: print(f" - {summary_part.text}")except StopIteration: print("\nNo reasoning steps found.")# 2. 网络搜索调用:智能体执行的具体搜索操作try: search_step = next(item for item in response.output if item.type == "web_search_call") print("\n[Found a Web Search Call - 这是执行步骤]") print(f" Query Executed: '{search_step.action['query']}'") print(f" Status: {search_step.status}")except StopIteration: print("\nNo web search steps found.")
Deep Research API 的规划能力:
-
- 自主规划研究流程:模型会根据研究问题,自动规划搜索策略、信息收集顺序、分析步骤
-
- 动态调整搜索策略:根据初步搜索结果,调整后续搜索方向,填补知识空白
-
- 结构化输出:最终生成带有引用的结构化报告,而不是简单的信息堆砌
这个例子展示了规划模式的高级应用:不仅规划执行步骤,还规划信息收集策略,并根据中间结果动态调整。
七、规划模式的应用场景
规划模式特别适合以下场景:
1. 复杂任务自动化
场景:新员工入职、项目启动、业务流程编排
规划流程:
- • 理解任务目标和约束(预算、时间、资源)
- • 分解成子任务(创建账户、分配培训、部门协调)
- • 确定执行顺序和依赖关系
- • 动态调整(如果某个步骤失败,调整后续计划)
收益:自动化复杂流程,减少人工干预,提高执行效率
2. 研究和信息整合
场景:竞品分析、市场调研、学术文献综述
规划流程:
- • 理解研究目标和范围
- • 规划信息收集策略(搜索关键词、数据源、分析方法)
- • 动态调整搜索方向(根据初步结果,填补知识空白)
- • 整合信息生成结构化报告
收益:系统化收集信息,减少遗漏,提高研究质量
3. 问题诊断和解决
场景:技术支持、故障排查、医疗诊断
规划流程:
- • 理解问题描述和症状
- • 规划诊断步骤(先检查什么、再测试什么)
- • 根据诊断结果,规划解决方案
- • 动态调整(如果方案无效,尝试其他方案)
收益:系统化解决问题,减少试错成本,提高解决效率
4. 内容创作和报告生成
场景:技术文档、研究报告、营销方案
规划流程:
- • 理解内容目标和受众
- • 规划内容结构(章节、要点、逻辑顺序)
- • 规划信息收集和整理步骤
- • 按计划生成内容
收益:内容结构更清晰,逻辑更严密,质量更稳定
八、成本与收益的权衡
规划模式虽然能显著提升 Agent 的自主能力,但也要付出代价:
成本
-
- 延迟增加:规划本身需要额外的 LLM 调用,总延迟 = 规划时间 + 执行时间
-
- 成本上升:规划过程需要额外的 token 消耗,成本 = 规划成本 + 执行成本
-
- 不确定性:动态规划可能产生不可预测的执行路径,难以提前估算成本和时间
-
- 调试困难:规划过程是动态的,难以复现和调试
收益
-
- 自主能力提升:Agent 能够处理更复杂的任务,减少人工干预
-
- 适应性增强:能够根据实际情况动态调整,提高成功率
-
- 可扩展性:不需要为每个新任务硬编码流程,更容易扩展
-
- 用户体验:用户只需要描述目标,不需要设计详细流程
何时使用规划模式?
适合使用的场景:
- • 任务复杂度高,步骤顺序不明确
- • 需要根据中间结果动态调整策略
- • 用户只提供目标,不提供执行方案
- • 任务需要探索和试错
不适合使用的场景:
- • 任务流程已经很清楚,不需要探索
- • 对延迟和成本敏感
- • 需要严格的可预测性和可复现性
- • 任务简单,一次性执行即可完成
经验法则:当“怎么做”需要探索,而不是预先知道时,使用规划模式。
九、与其他模式的结合
规划模式可以和其他模式组合使用,形成更强大的系统:
1. 规划 + 提示链
规划生成执行步骤,提示链执行每个步骤:
用户目标
规划:生成步骤序列
提示链:执行步骤1
提示链:执行步骤2
提示链:执行步骤3
完成目标
2. 规划 + 路由
规划决定整体策略,路由选择具体执行路径:
路径A
路径B
用户目标
规划:确定整体策略
路由:选择执行路径
Agent A
Agent B
完成目标
3. 规划 + 反思
规划生成执行步骤,反思优化每个步骤的输出:
用户目标
规划:生成步骤序列
执行步骤1
反思:优化输出
执行步骤2
反思:优化输出
完成目标
4. 规划 + 工具使用
规划决定工具调用顺序,工具使用执行具体操作:
用户目标
规划:确定工具调用顺序
工具使用:调用工具1
工具使用:调用工具2
工具使用:调用工具3
完成目标
十、工程化最佳实践
-
- 明确规划边界:不是所有任务都需要规划,简单任务直接执行即可
-
- 设置规划约束:限制规划深度、步骤数量、执行时间,避免过度规划
-
- 规划结果验证:在执行前验证规划结果的合理性,避免执行无效计划
-
- 动态调整机制:建立完善的异常检测和计划调整机制
-
- 成本监控:记录规划过程的 token 消耗,设置预算上限
-
- 可观测性:记录规划过程、执行步骤、调整原因,方便调试和优化
-
- 用户参与:对于重要任务,可以让用户审阅和修改规划结果
-
- 降级策略:如果规划失败,要有降级到固定流程的备选方案
十一、核心要点总结
规划模式的本质:通过任务分解和动态调整,让 Agent 能够自主发现“怎么做”的方案,从“被动执行”升级到“主动规划”。
适用场景:
- • 复杂任务自动化
- • 研究和信息整合
- • 问题诊断和解决
- • 内容创作和报告生成
关键成功因素:
-
- 明确的目标理解:准确理解用户想要什么,以及约束条件
-
- 有效的任务分解:把复杂目标拆解成可执行的子任务
-
- 合理的步骤排序:确定子任务的执行顺序和依赖关系
-
- 灵活的动态调整:根据执行结果和新信息,调整后续计划
权衡考虑:
- • ✅ 自主能力显著提升
- • ✅ 适应性增强
- • ❌ 延迟和成本增加
- • ❌ 不确定性增加
- • ⚖️ 根据场景权衡使用
十二、看完这一期,可以做点什么?
-
- 识别需要规划的场景:列出你现有 Agent 中“不知道怎么做”的场景
-
- 设计规划流程:确定任务分解策略、步骤排序规则、动态调整机制
-
- 实现一个简单的规划 Agent:从 CrewAI 示例开始,逐步增加复杂度
-
- 监控规划效果:记录规划时间、执行时间、成功率、成本
-
- 优化规划策略:根据实际效果调整规划深度、步骤数量、调整机制
把这个能力加上之后,你的 Agent 才算真正具备了“项目经理”的思维。
下期预告:多智能体协作——让 Agent 学会“团队作战”
当单个 Agent 能够规划复杂任务之后,下一步自然就是:让多个 Agent 协作完成更复杂的任务,每个 Agent 负责不同的角色,通过协作达成共同目标。
下一期我们会聊多智能体模式(Multi-Agent Pattern):如何让多个 Agent 协作完成复杂任务,包括角色分工、任务分配、通信机制、冲突解决。
如果你已经有一些“需要多个专家协作”的场景,不妨提前想一想:
哪些任务可以拆给不同的 Agent?它们之间如何通信?如何协调执行?
大模型未来如何发展?普通人能从中受益吗?
在科技日新月异的今天,大模型已经展现出了令人瞩目的能力,从编写代码到医疗诊断,再到自动驾驶,它们的应用领域日益广泛。那么,未来大模型将如何发展?普通人又能从中获得哪些益处呢?
通用人工智能(AGI)的曙光:未来,我们可能会见证通用人工智能(AGI)的出现,这是一种能够像人类一样思考的超级模型。它们有可能帮助人类解决气候变化、癌症等全球性难题。这样的发展将极大地推动科技进步,改善人类生活。
个人专属大模型的崛起:想象一下,未来的某一天,每个人的手机里都可能拥有一个私人AI助手。这个助手了解你的喜好,记得你的日程,甚至能模仿你的语气写邮件、回微信。这样的个性化服务将使我们的生活变得更加便捷。
脑机接口与大模型的融合:脑机接口技术的发展,使得大模型与人类的思维直接连接成为可能。未来,你可能只需戴上头盔,心中想到写一篇工作总结”,大模型就能将文字直接投影到屏幕上,实现真正的心想事成。
大模型的多领域应用:大模型就像一个超级智能的多面手,在各个领域都展现出了巨大的潜力和价值。随着技术的不断发展,相信未来大模型还会给我们带来更多的惊喜。赶紧把这篇文章分享给身边的朋友,一起感受大模型的魅力吧!
那么,如何学习AI大模型?
在一线互联网企业工作十余年里,我指导过不少同行后辈,帮助他们得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑。因此,我坚持整理和分享各种AI大模型资料,包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频。
学习阶段包括:
1.大模型系统设计
从大模型系统设计入手,讲解大模型的主要方法。包括模型架构、训练过程、优化策略等,让读者对大模型有一个全面的认识。

2.大模型提示词工程
通过大模型提示词工程,从Prompts角度入手,更好发挥模型的作用。包括提示词的构造、优化、应用等,让读者学会如何更好地利用大模型。

3.大模型平台应用开发
借助阿里云PAI平台,构建电商领域虚拟试衣系统。从需求分析、方案设计、到具体实现,详细讲解如何利用大模型构建实际应用。

4.大模型知识库应用开发
以LangChain框架为例,构建物流行业咨询智能问答系统。包括知识库的构建、问答系统的设计、到实际应用,让读者了解如何利用大模型构建智能问答系统。
5.大模型微调开发
借助以大健康、新零售、新媒体领域,构建适合当前领域的大模型。包括微调的方法、技巧、到实际应用,让读者学会如何针对特定领域进行大模型的微调。


6.SD多模态大模型
以SD多模态大模型为主,搭建文生图小程序案例。从模型选择、到小程序的设计、到实际应用,让读者了解如何利用大模型构建多模态应用。
7.大模型平台应用与开发
通过星火大模型、文心大模型等成熟大模型,构建大模型行业应用。包括行业需求分析、方案设计、到实际应用,让读者了解如何利用大模型构建行业应用。


学成之后的收获👈
• 全栈工程实现能力:通过学习,你将掌握从前端到后端,从产品经理到设计,再到数据分析等一系列技能,实现全方位的技术提升。
• 解决实际项目需求:在大数据时代,企业和机构面临海量数据处理的需求。掌握大模型应用开发技能,将使你能够更准确地分析数据,更有效地做出决策,更好地应对各种实际项目挑战。
• AI应用开发实战技能:你将学习如何基于大模型和企业数据开发AI应用,包括理论掌握、GPU算力运用、硬件知识、LangChain开发框架应用,以及项目实战经验。此外,你还将学会如何进行Fine-tuning垂直训练大模型,包括数据准备、数据蒸馏和大模型部署等一站式技能。
• 提升编码能力:大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握将提升你的编码能力和分析能力,使你能够编写更高质量的代码。
学习资源📚
- AI大模型学习路线图:为你提供清晰的学习路径,助你系统地掌握AI大模型知识。
- 100套AI大模型商业化落地方案:学习如何将AI大模型技术应用于实际商业场景,实现技术的商业化价值。
- 100集大模型视频教程:通过视频教程,你将更直观地学习大模型的技术细节和应用方法。
- 200本大模型PDF书籍:丰富的书籍资源,供你深入阅读和研究,拓宽你的知识视野。
- LLM面试题合集:准备面试,了解大模型领域的常见问题,提升你的面试通过率。
- AI产品经理资源合集:为你提供AI产品经理的实用资源,帮助你更好地管理和推广AI产品。
👉获取方式: 😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】

更多推荐



所有评论(0)