ReAct 范式Reasoning(推理)+ Acting(行动)的缩写。

它是目前构建 AI Agent(智能体 最主流、最核心的模式。

简单来说,ReAct 就是让大模型学会“一边思考,一边干活” ,而不是像以前那样只会“闭门造车”。


1.🔄 核心公式:思考 + 行动 = 解决问题

在 ReAct 出现之前,大模型主要有两种状态:

  1. 纯推理 (Chain of Thought)

    1. AI 在脑子里通过逻辑推导得出答案。

    2. 缺点:如果它不知道现在的天气,它只能瞎编(幻觉),因为它没法联网。

  2. 纯行动 (Action only)

    1. AI 只是简单地调用工具。

    2. 缺点:缺乏规划,容易像无头苍蝇一样乱点按钮。

ReAct 将两者结合了起来: 它要求模型在执行每一个动作之前,先写下自己的思考(Thought);在执行动作后,观察结果(Observation),再决定下一步做什么。


2.🧬 ReAct 的“三步走”循环

ReAct 范式把解决一个复杂问题拆解成了无数个小的循环,每个循环包含三个步骤:

  1. Thought (思考)

    1. AI 自言自语:“用户问我‘现在纽约的天气怎么样?’,所以我首先需要查找纽约的天气。”

  2. Action (行动)

    1. AI 调用工具:Search_Tool.run("Current weather in New York")

  3. Observation (观察)

    1. AI 看到工具返回的结果:“纽约现在晴天,25摄氏度。”

    2. (然后进入下一个循环)

    3. Thought:我拿到数据了,可以直接回答用户了。

    4. Final Answer:纽约现在是晴天,25度。


3.🕵️♂️ 实战案例:谁是钢铁侠的扮演者的老婆?

假设你问 AI:“钢铁侠扮演者的老婆是谁?”(这是一个典型的多跳问题)。

  • 普通 LLM

    • 可能会直接根据训练数据猜一个名字,或者如果数据太旧,它可能不知道。

  • ReAct Agent

    • Thought 1:我需要先找出谁扮演了钢铁侠。

    • Action 1:搜索 "Iron Man actor"。

    • Observation 1:搜索结果显示是 "Robert Downey Jr."。

    • Thought 2:现在我知道是小罗伯特·唐尼了,我需要查他的老婆是谁。

    • Action 2:搜索 "Robert Downey Jr. wife"。

    • Observation 2:搜索结果显示是 "Susan Downey"。

    • Thought 3:我有答案了。

    • Final Answer:是苏珊·唐尼 (Susan Downey)。


4.🚀 为什么 ReAct 这么重要?

ReAct 是 AI 从“聊天机器人”进化为“办事员”的关键技术:

  1. 减少幻觉

    1. 因为每一步都有 Observation(真实世界的反馈)作为支撑,AI 不再需要瞎编。如果搜索不到,它会说“我搜不到”。

  2. 实时性

    1. 通过 Action 调用搜索工具,AI 可以获取此时此刻的最新信息。

  3. 可解释性

    1. 你可以看到 AI 的 Thought 日志,清楚地知道它是怎么一步步推导出答案的,而不是一个黑盒。


总结

ReAct 范式 就是给大模型装上了“手”(工具)“眼睛”(观察),并教会它一套“做事的逻辑”

它是目前所有主流 Agent 框架(如 LangChain, AutoGPT)背后的底层逻辑。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐