Agent 是指能够自主感知环境、做出决策并执行动作的实体,其行为不受外界强制控制,而是基于自身目标和环境信息独立运作。简单来说,它是 “能自主行动的个体”,既可以是物理实体(如机器人),也可以是虚拟实体(如软件程序)。

 ReAct 是 Agent 领域中一种非常重要的运行框架(或工作模式),全称可以理解为 “Reasoning(推理)+ Action(行动)” 的结合。简单说,它是让 Agent 像人一样 “边想边做” 的模式 —— 通过 “思考该做什么→动手尝试→根据结果再调整思路” 的循环,一步步解决复杂问题。

ReAct 的核心运行步骤:四步循环

ReAct 的运行可以拆解为一个不断重复的闭环,每一轮都包含 4 个关键环节:

1. 任务接收:明确 “要做什么”

Agent 先拿到用户的目标(比如 “帮我规划从北京到上海的 3 天旅游行程”),这是整个循环的起点。

2. 推理(Reasoning):“我该先做什么?”

Agent 开始 “思考”:分析任务目标,拆解问题,规划下一步动作。比如:

  • “用户要旅游行程,得先知道他喜欢自然风光还是城市景点?”
  • “不知道他的出发时间和预算,这些信息会影响行程安排,得先问清楚。”
  • “如果他说喜欢历史景点,下一步就该搜上海的历史景点列表。”

这个 “思考” 过程不是瞎想,而是基于已有信息(比如用户历史偏好、常识)和任务目标,判断 “当前最该做的事”。

3. 行动(Action):“动手去试”

根据推理结果,Agent 执行具体操作(比如调用工具、查询信息、与人交互等)。比如:

  • 推理出 “需要用户的偏好”,行动就是 “发送问题:‘你更喜欢自然景观还是人文景点?’”;
  • 推理出 “需要查景点”,行动就是 “调用地图工具搜索上海历史景点”;
  • 推理出 “需要订酒店”,行动就是 “调用酒店预订 API 查价格和位置”。

行动的目的是获取新信息或推进任务,相当于 Agent “动手收集素材”。

4. 观察(Observation):“看看结果怎么样”

行动后,Agent 会获取反馈(比如用户的回答、工具返回的数据、环境的变化)。比如:

  • 问用户偏好后,观察到反馈:“用户说喜欢自然 + 美食”;
  • 搜景点后,观察到结果:“上海有外滩、豫园、迪士尼,其中迪士尼适合自然 + 娱乐,但人可能多”;
  • 订酒店时,观察到反馈:“某酒店价格超出预算”。
5. 循环:用新信息继续 “推理 - 行动”

拿到观察结果后,Agent 会把新信息加入 “思考库”,重复第二步的推理:“现在知道用户喜欢自然 + 美食,预算有限,那下一步该排除高价酒店,优先选靠近景点和美食街的住宿……” 直到任务完成(比如行程规划好并确认)。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐