当 Agent 不知道“怎么做”时,会发生什么?

如果你已经用提示链、路由、并行化、反思把 Agent 工作流搭得有模有样,接下来可能会遇到这个场景:

  • • 用户说“帮我组织一次团队团建活动”,Agent 一脸懵:从哪开始?要做什么?先做什么后做什么?
  • • 老板要求“做一份竞品分析报告”,Agent 知道要分析,但不知道应该先收集信息、再对比分析、最后总结,还是反过来?
  • • 客户支持遇到复杂问题,Agent 能识别问题,但不知道应该先诊断、再测试、最后升级,还是直接转人工?

这时候你可能会想:能不能让 Agent 自己先想清楚“怎么做”,再开始执行?

这就是本期要聊的规划模式(Planning Pattern)——让 Agent 学会“先规划后执行”,把复杂目标拆解成可执行的步骤序列,从“被动响应”升级到“主动规划”。
在这里插入图片描述

一、为什么需要规划?从“知道做什么”到“知道怎么做”

在之前的几期里,我们聊过提示链、路由、并行化、反思,它们解决的都是“如何组织执行流程”的问题。但有一个前提一直没解决:Agent 得先知道“怎么做”,才能开始执行。


用户需求“组织团队团建”
Agent 知道要做什么
但不知道怎么做
要么卡住 / 要么乱做

现实中的痛点很常见:

    1. 目标太抽象:用户说“做个竞品分析”,但 Agent 不知道应该先收集信息、再对比分析、最后总结
    1. 步骤不明确:任务需要多个步骤,但 Agent 不知道先做什么、后做什么、哪些可以并行
    1. 依赖关系混乱:有些步骤必须等前一步完成,但 Agent 不知道这些依赖关系
    1. 动态调整困难:执行过程中遇到问题,Agent 不知道如何调整计划

传统的解决方案是:人工制定详细流程 + 硬编码到 Agent。但这样既死板又难维护,而且每个新任务都要重新设计。

规划模式要做的,就是把这个“人工规划”的过程自动化:


是

否
用户需求“组织团队团建”
规划 Agent分解目标
生成执行计划步骤1 → 步骤2 → 步骤3
执行 Agent按计划执行
遇到问题?
动态调整计划
完成目标

核心思想:不是让 Agent 直接执行复杂任务,而是让它先规划 → 再执行 → 遇到问题动态调整,直到目标达成。

二、规划模式到底在做什么?

一句话概括:规划模式就是让 Agent 把复杂目标拆解成可执行的步骤序列,并动态调整执行策略的能力。

从工程视角看,规划至少包含四个要素:

    1. 目标理解:理解用户想要什么(what),以及约束条件(预算、时间、资源等)
    1. 任务分解:把复杂目标拆解成更小、可管理的子任务
    1. 步骤排序:确定子任务的执行顺序和依赖关系
    1. 动态调整:根据执行结果和新信息,调整后续计划

一个典型的规划流程大概是这样:

Tools/APIs
Executor Agent
Planner Agent
User
Tools/APIs
Executor Agent
Planner Agent
User
alt
[需要调整计划]
loop
[执行每个步骤]
复杂目标(如"组织团队团建")
理解目标和约束
分解成子任务
确定执行顺序
展示计划(可选)
执行计划
调用工具/API
返回结果
评估结果
请求调整
重新规划
更新计划
返回最终结果

在原书的 21 个模式里,规划模式是很多高级模式的基础:多智能体协作需要规划来分配任务,工具使用模式需要规划来决定调用顺序,甚至反思模式也需要规划来组织评估流程。

三、规划 vs 提示链 vs 反思:什么时候用哪个?

这三个模式经常被混淆,但它们解决的是不同层面的问题:

模式 解决的问题 适用场景 关键区别
提示链 如何把复杂任务拆成固定步骤 步骤顺序已知、流程相对固定 流程是预先设计好的
规划 如何发现“怎么做”的方案 步骤顺序未知、需要探索 流程是动态生成的
反思 如何提升输出质量 输出质量不稳定、需要迭代优化 关注质量改进而非流程设计

举个具体例子

  • 提示链:你明确知道“提取信息 → 结构化整理 → 生成报告”这个流程,用提示链把三个步骤串起来
  • 规划:你不知道“组织团队团建”应该怎么做,让 Agent 先规划出“确定预算 → 选择地点 → 预订场地 → 安排交通 → 发送通知”这个流程
  • 反思:Agent 已经生成了报告,但质量不够好,用反思模式让它自己检查并优化

经验法则

  • • 如果“怎么做”已经很清楚 → 用提示链
  • • 如果“怎么做”需要探索 → 用规划
  • • 如果输出质量需要提升 → 用反思

当然,这三个模式可以组合使用:规划生成流程 → 提示链执行步骤 → 反思优化输出。

四、规划模式的核心机制:从目标到行动

规划模式最核心的能力是任务分解(Task Decomposition)动态调整(Dynamic Adaptation)

1. 任务分解:把大象装进冰箱需要几步?

任务分解就是把复杂目标拆解成可执行的子任务。这个过程通常包括:

  • 识别关键步骤:完成目标需要哪些主要步骤?
  • 确定依赖关系:哪些步骤必须先完成,哪些可以并行?
  • 评估资源需求:每个步骤需要什么工具、数据、权限?

复杂目标“组织团队团建”
任务分解
确定预算和人数
选择地点和时间
预订场地和餐饮
安排交通
发送通知
2. 动态调整:计划赶不上变化怎么办?

规划不是一次性的,而是持续的过程。当执行过程中遇到问题,Agent 需要能够调整计划:

  • 检测异常:执行结果不符合预期、遇到错误、资源不可用
  • 重新评估:分析当前状态,确定是否需要调整计划
  • 生成新计划:基于新信息,生成调整后的执行步骤

是
否

执行步骤1
结果符合预期?
继续执行步骤2
分析问题
调整计划
重新执行或跳过
完成目标

这种动态调整能力,让规划模式区别于固定的工作流:它不是“按剧本演戏”,而是“边演边改剧本”

五、实战代码:CrewAI 实现

CrewAI 通过 AgentTask 的组合,可以很直观地实现规划模式。下面是一个“先规划后写作”的示例:

import osfrom dotenv import load_dotenvfrom crewai import Agent, Task, Crew, Processfrom langchain_openai import ChatOpenAI# 安装依赖# pip install crewai langchain-openai python-dotenv# 从 .env 文件加载环境变量(如 OPENAI_API_KEY)load_dotenv()# 检查 API 密钥是否设置if not os.getenv("OPENAI_API_KEY"):    raise ValueError("OPENAI_API_KEY not found in .env file. Please add it.")# 明确指定使用的模型llm = ChatOpenAI(model="gpt-4-turbo", temperature=0.1)# 定义一个具备规划能力的智能体# 它的角色是"规划者+写作者",先制定计划,再执行写作planner_writer_agent = Agent(    role='Article Planner and Writer',    goal='Plan and then write a concise, engaging summary on a specified topic.',    backstory=(        'You are an expert technical writer and content strategist. '        'Your strength lies in creating a clear, actionable plan before writing, '        'ensuring the final summary is both informative and easy to digest.'    ),    verbose=True,  # 显示执行过程,方便观察规划过程    allow_delegation=False,  # 这个任务不需要委托给其他 Agent    llm=llm)# 定义一个需要规划的任务# 注意:任务描述明确要求"先规划,再执行"topic = "The importance of Reinforcement Learning in AI"high_level_task = Task(    description=(        f"1. Create a bullet-point plan for a summary on the topic: '{topic}'.\n"        f"2. Write the summary based on your plan, keeping it around 200 words."    ),    expected_output=(        "A final report containing two distinct sections:\n\n"        "### Plan\n"        "- A bulleted list outlining the main points of the summary.\n\n"        "### Summary\n"        "- A concise and well-structured summary of the topic."    ),    agent=planner_writer_agent,)# 创建 Crew 实例,使用顺序执行流程crew = Crew(    agents=[planner_writer_agent],    tasks=[high_level_task],    process=Process.sequential,  # 顺序执行,确保先规划后写作)# 执行任务print("## Running the planning and writing task ##")result = crew.kickoff()print("\n\n---\n## Task Result ##\n---")print(result)

关键设计点

    1. 任务描述明确要求规划:通过 description 明确要求 Agent 先创建计划,再执行写作
    1. 输出格式结构化:通过 expected_output 定义输出格式,确保规划结果和最终输出分离
    1. 顺序执行保证:使用 Process.sequential 确保先规划后执行
    1. verbose 模式:开启 verbose=True 可以观察 Agent 的规划过程,方便调试

这个例子展示了规划模式的核心:不是直接执行任务,而是先规划,再按计划执行

六、实战代码:OpenAI Deep Research API

OpenAI 的 Deep Research API 是规划模式的一个高级应用:它能够自主规划研究流程,动态调整搜索策略,最终生成结构化的研究报告。

from openai import OpenAI# 使用你的 API 密钥初始化 OpenAI 客户端client = OpenAI(api_key="YOUR_OPENAI_API_KEY")# 定义智能体的角色和研究问题system_message = """You are a professional researcher preparing a structured, data-driven report.Focus on data-rich insights, use reliable sources, and include inline citations."""user_query = "Research the economic impact of semaglutide on global healthcare systems."# 调用深度研究 API# 注意:这里只需要提供目标和约束,不需要指定具体的研究步骤response = client.responses.create(  model="o3-deep-research-2025-06-26",  # 使用深度研究专用模型  input=[    {      "role": "developer",      "content": [{"type": "input_text", "text": system_message}]    },    {      "role": "user",      "content": [{"type": "input_text", "text": user_query}]    }  ],  reasoning={"summary": "auto"},  # 自动生成推理摘要,可以看到规划过程  tools=[{"type": "web_search_preview"}]  # 提供网络搜索工具)# 访问最终报告final_report = response.output[-1].content[0].textprint(final_report)# 访问内联引用和元数据print("\n--- CITATIONS ---")annotations = response.output[-1].content[0].annotationsif annotations:    for i, citation in enumerate(annotations):        cited_text = final_report[citation.start_index:citation.end_index]        print(f"Citation {i+1}:")        print(f"  Cited Text: {cited_text}")        print(f"  Title: {citation.title}")        print(f"  URL: {citation.url}")# 检查中间步骤(可以看到规划过程)print("\n--- INTERMEDIATE STEPS ---")# 1. 推理步骤:模型生成的内部计划和总结try:    reasoning_step = next(item for item in response.output if item.type == "reasoning")    print("\n[Found a Reasoning Step - 这是规划过程]")    for summary_part in reasoning_step.summary:        print(f"  - {summary_part.text}")except StopIteration:    print("\nNo reasoning steps found.")# 2. 网络搜索调用:智能体执行的具体搜索操作try:    search_step = next(item for item in response.output if item.type == "web_search_call")    print("\n[Found a Web Search Call - 这是执行步骤]")    print(f"  Query Executed: '{search_step.action['query']}'")    print(f"  Status: {search_step.status}")except StopIteration:    print("\nNo web search steps found.")

Deep Research API 的规划能力

    1. 自主规划研究流程:模型会根据研究问题,自动规划搜索策略、信息收集顺序、分析步骤
    1. 动态调整搜索策略:根据初步搜索结果,调整后续搜索方向,填补知识空白
    1. 结构化输出:最终生成带有引用的结构化报告,而不是简单的信息堆砌

这个例子展示了规划模式的高级应用:不仅规划执行步骤,还规划信息收集策略,并根据中间结果动态调整

七、规划模式的应用场景

规划模式特别适合以下场景:

1. 复杂任务自动化

场景:新员工入职、项目启动、业务流程编排

规划流程

  • • 理解任务目标和约束(预算、时间、资源)
  • • 分解成子任务(创建账户、分配培训、部门协调)
  • • 确定执行顺序和依赖关系
  • • 动态调整(如果某个步骤失败,调整后续计划)

收益:自动化复杂流程,减少人工干预,提高执行效率

2. 研究和信息整合

场景:竞品分析、市场调研、学术文献综述

规划流程

  • • 理解研究目标和范围
  • • 规划信息收集策略(搜索关键词、数据源、分析方法)
  • • 动态调整搜索方向(根据初步结果,填补知识空白)
  • • 整合信息生成结构化报告

收益:系统化收集信息,减少遗漏,提高研究质量

3. 问题诊断和解决

场景:技术支持、故障排查、医疗诊断

规划流程

  • • 理解问题描述和症状
  • • 规划诊断步骤(先检查什么、再测试什么)
  • • 根据诊断结果,规划解决方案
  • • 动态调整(如果方案无效,尝试其他方案)

收益:系统化解决问题,减少试错成本,提高解决效率

4. 内容创作和报告生成

场景:技术文档、研究报告、营销方案

规划流程

  • • 理解内容目标和受众
  • • 规划内容结构(章节、要点、逻辑顺序)
  • • 规划信息收集和整理步骤
  • • 按计划生成内容

收益:内容结构更清晰,逻辑更严密,质量更稳定

八、成本与收益的权衡

规划模式虽然能显著提升 Agent 的自主能力,但也要付出代价:

成本
    1. 延迟增加:规划本身需要额外的 LLM 调用,总延迟 = 规划时间 + 执行时间
    1. 成本上升:规划过程需要额外的 token 消耗,成本 = 规划成本 + 执行成本
    1. 不确定性:动态规划可能产生不可预测的执行路径,难以提前估算成本和时间
    1. 调试困难:规划过程是动态的,难以复现和调试
收益
    1. 自主能力提升:Agent 能够处理更复杂的任务,减少人工干预
    1. 适应性增强:能够根据实际情况动态调整,提高成功率
    1. 可扩展性:不需要为每个新任务硬编码流程,更容易扩展
    1. 用户体验:用户只需要描述目标,不需要设计详细流程
何时使用规划模式?

适合使用的场景

  • • 任务复杂度高,步骤顺序不明确
  • • 需要根据中间结果动态调整策略
  • • 用户只提供目标,不提供执行方案
  • • 任务需要探索和试错

不适合使用的场景

  • • 任务流程已经很清楚,不需要探索
  • • 对延迟和成本敏感
  • • 需要严格的可预测性和可复现性
  • • 任务简单,一次性执行即可完成

经验法则当“怎么做”需要探索,而不是预先知道时,使用规划模式。

九、与其他模式的结合

规划模式可以和其他模式组合使用,形成更强大的系统:

1. 规划 + 提示链

规划生成执行步骤,提示链执行每个步骤:


用户目标
规划:生成步骤序列
提示链:执行步骤1
提示链:执行步骤2
提示链:执行步骤3
完成目标
2. 规划 + 路由

规划决定整体策略,路由选择具体执行路径:


路径A
路径B

用户目标
规划:确定整体策略
路由:选择执行路径
Agent A
Agent B
完成目标
3. 规划 + 反思

规划生成执行步骤,反思优化每个步骤的输出:


用户目标
规划:生成步骤序列
执行步骤1
反思:优化输出
执行步骤2
反思:优化输出
完成目标
4. 规划 + 工具使用

规划决定工具调用顺序,工具使用执行具体操作:


用户目标
规划:确定工具调用顺序
工具使用:调用工具1
工具使用:调用工具2
工具使用:调用工具3
完成目标

十、工程化最佳实践

    1. 明确规划边界:不是所有任务都需要规划,简单任务直接执行即可
    1. 设置规划约束:限制规划深度、步骤数量、执行时间,避免过度规划
    1. 规划结果验证:在执行前验证规划结果的合理性,避免执行无效计划
    1. 动态调整机制:建立完善的异常检测和计划调整机制
    1. 成本监控:记录规划过程的 token 消耗,设置预算上限
    1. 可观测性:记录规划过程、执行步骤、调整原因,方便调试和优化
    1. 用户参与:对于重要任务,可以让用户审阅和修改规划结果
    1. 降级策略:如果规划失败,要有降级到固定流程的备选方案

十一、核心要点总结

规划模式的本质:通过任务分解和动态调整,让 Agent 能够自主发现“怎么做”的方案,从“被动执行”升级到“主动规划”。

适用场景

  • • 复杂任务自动化
  • • 研究和信息整合
  • • 问题诊断和解决
  • • 内容创作和报告生成

关键成功因素

    1. 明确的目标理解:准确理解用户想要什么,以及约束条件
    1. 有效的任务分解:把复杂目标拆解成可执行的子任务
    1. 合理的步骤排序:确定子任务的执行顺序和依赖关系
    1. 灵活的动态调整:根据执行结果和新信息,调整后续计划

权衡考虑

  • • ✅ 自主能力显著提升
  • • ✅ 适应性增强
  • • ❌ 延迟和成本增加
  • • ❌ 不确定性增加
  • • ⚖️ 根据场景权衡使用

十二、看完这一期,可以做点什么?

    1. 识别需要规划的场景:列出你现有 Agent 中“不知道怎么做”的场景
    1. 设计规划流程:确定任务分解策略、步骤排序规则、动态调整机制
    1. 实现一个简单的规划 Agent:从 CrewAI 示例开始,逐步增加复杂度
    1. 监控规划效果:记录规划时间、执行时间、成功率、成本
    1. 优化规划策略:根据实际效果调整规划深度、步骤数量、调整机制

把这个能力加上之后,你的 Agent 才算真正具备了“项目经理”的思维。


普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

图片

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

图片

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

image.png

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:
图片

04 视频和书籍PDF合集

图片

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

图片

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
图片

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!
图片

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)图片
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐