什么是Agent？

其行为不受外界强制控制，而是基于自身目标和环境信息独立运作。简单来说，它是 “”，既可以是物理实体（如机器人），也可以是虚拟实体（如软件程序）。是 Agent 领域中一种非常重要的运行框架（或工作模式），全称可以理解为的结合。简单说，它是让 Agent 像人一样 “边想边做” 的模式 —— 通过 “思考该做什么→动手尝试→根据结果再调整思路” 的循环，一步步解决复杂问题。

Wlq0415

317人浏览 · 2025-08-12 10:38:10

Wlq0415 · 2025-08-12 10:38:10 发布

Agent 是指能够自主感知环境、做出决策并执行动作的实体，其行为不受外界强制控制，而是基于自身目标和环境信息独立运作。简单来说，它是 “能自主行动的个体”，既可以是物理实体（如机器人），也可以是虚拟实体（如软件程序）。

ReAct 是 Agent 领域中一种非常重要的运行框架（或工作模式），全称可以理解为 “Reasoning（推理）+ Action（行动）” 的结合。简单说，它是让 Agent 像人一样 “边想边做” 的模式 —— 通过 “思考该做什么→动手尝试→根据结果再调整思路” 的循环，一步步解决复杂问题。

ReAct 的核心运行步骤：四步循环

ReAct 的运行可以拆解为一个不断重复的闭环，每一轮都包含 4 个关键环节：

1. 任务接收：明确 “要做什么”

Agent 先拿到用户的目标（比如 “帮我规划从北京到上海的 3 天旅游行程”），这是整个循环的起点。

2. 推理（Reasoning）：“我该先做什么？”

Agent 开始 “思考”：分析任务目标，拆解问题，规划下一步动作。比如：

“用户要旅游行程，得先知道他喜欢自然风光还是城市景点？”
“不知道他的出发时间和预算，这些信息会影响行程安排，得先问清楚。”
“如果他说喜欢历史景点，下一步就该搜上海的历史景点列表。”

这个 “思考” 过程不是瞎想，而是基于已有信息（比如用户历史偏好、常识）和任务目标，判断 “当前最该做的事”。

3. 行动（Action）：“动手去试”

根据推理结果，Agent 执行具体操作（比如调用工具、查询信息、与人交互等）。比如：

推理出 “需要用户的偏好”，行动就是 “发送问题：‘你更喜欢自然景观还是人文景点？’”；
推理出 “需要查景点”，行动就是 “调用地图工具搜索上海历史景点”；
推理出 “需要订酒店”，行动就是 “调用酒店预订 API 查价格和位置”。

行动的目的是获取新信息或推进任务，相当于 Agent “动手收集素材”。

4. 观察（Observation）：“看看结果怎么样”

行动后，Agent 会获取反馈（比如用户的回答、工具返回的数据、环境的变化）。比如：

问用户偏好后，观察到反馈：“用户说喜欢自然 + 美食”；
搜景点后，观察到结果：“上海有外滩、豫园、迪士尼，其中迪士尼适合自然 + 娱乐，但人可能多”；
订酒店时，观察到反馈：“某酒店价格超出预算”。

5. 循环：用新信息继续 “推理 - 行动”

拿到观察结果后，Agent 会把新信息加入 “思考库”，重复第二步的推理：“现在知道用户喜欢自然 + 美食，预算有限，那下一步该排除高价酒店，优先选靠近景点和美食街的住宿……” 直到任务完成（比如行程规划好并确认）。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI“会不会写代码”已不再是问题，真正决定其能否成为开发者得力助手的关键，在于它“能不能理解上下文这些擦收

2048 AI社区

运维从静态到动态

系统架构相对固定，扩展性较差，故障恢复依赖人工干预，监控以阈值告警为主，缺乏实时分析能力。Prometheus+Grafana实现指标采集与可视化，ELK栈处理日志分析，分布式追踪工具（如Jaeger）监控微服务链路，AIops平台进行异常检测。云原生架构支持自动扩缩容，服务网格（如Istio）实现流量动态调度，多活部署保障故障自动切换，混沌工程验证系统容错能力。动态运维最终目标是实现声明式管理，