从理论到实践：我的ReAct Agent探索之旅

最近深入学习了Agent（智能体）的相关知识，被其“自主决策、与环境互动”的魅力深深吸引。课程中提到的Agent本质公式（大模型 + 记忆 + 工具 = Agent）和主流架构（ReAct、Plan-and-Solve等），让我对AI系统的智能化有了全新认识。为了将理论落地，我决定亲手实践ReAct Agent——这场从“纸上谈兵”到“代码跑通”的旅程，充满了挑战与惊喜，也有一个小小的遗憾。从理论

2501_93868612

961人浏览 · 2025-12-20 15:29:12

2501_93868612 · 2025-12-20 15:29:12 发布

前言

最近深入学习了Agent（智能体）的相关知识，被其“自主决策、与环境互动”的魅力深深吸引。课程中提到的Agent本质公式（大模型 + 记忆 + 工具 = Agent） 和主流架构（ReAct、Plan-and-Solve等），让我对AI系统的智能化有了全新认识。为了将理论落地，我决定亲手实践ReAct Agent——这场从“纸上谈兵”到“代码跑通”的旅程，充满了挑战与惊喜，也有一个小小的遗憾。

一、理论认知：Agent的世界观

在动手前，我先梳理了Agent的核心概念：

本质：Agent是“能感知环境、做决策、采取行动以实现目标的自主实体”，其核心是“大模型+记忆+工具”的组合。
特征：自主性（无需人工干预）、反应性（实时响应环境）、主动性（主动追求目标）、社会性（与人或其他Agent交互）。
主流架构：
ReAct：边想边做，通过“观察→思考→行动→观察”循环决策，适合动态任务；
Plan-and-Solve：先规划再执行，保证多步骤任务的一致性；
Reflection：执行后反思优化，追求高精度。。

二、实践困境：环境搭建与工具限制

1. 环境搭建的“拦路虎”

带着对ReAct的好奇，我开始搭建开发环境。然而，第一步就遇到了麻烦：

版本冲突：原Python版本过低（3.9），而ReAct依赖的库需要Python 3.10+；PyCharm默认解释器也未更新，导致库安装后无法识别。
库的“隐形门槛”：我用pip install openai json5 requests安装了必要库，但在PyCharm中运行代码时，仍提示“ModuleNotFoundError”——原来库安装在了全局环境，而PyCharm用的是虚拟环境，两者路径不互通。

2. Serper注册的“绊脚石”（遗憾时刻）

在深入学习ReAct时，我了解到Serper API是常用的“工具”之一（用于获取实时网页信息，帮助Agent回答时效性问题）。为了体验完整的ReAct流程，我尝试申请Serper的免费Token，却遭遇了连续挫折：

邮箱频繁被拒：换了3个邮箱（包括国内163、QQ邮箱和国外Gmail），均因“验证问题”未能通过审核。
谷歌服务的“地域壁垒”：第一次下载谷歌浏览器时，我不知道国内访问谷歌服务需要梯子——直到尝试登录谷歌账号时才意识到这个问题。即使后来解决了梯子问题，最终还是没能拿到谷歌邮箱，导致Serper注册失败。

这件事让我深刻认识到：技术实践中，“工具可用性”往往比“理论掌握”更关键。有些海外工具的本地化限制，可能会成为新手实践的“隐性壁垒”。不过，这也激励我未来会更注重寻找替代方案（比如国内的搜索引擎API），或提前调研工具的地域限制。

三、破局之路：向AI和文档求助

面对环境问题，我没有慌乱，而是采取了“分层解决法”：

升级版本：先将Python升级到3.14.2，再用PyCharm的“File→Settings→Project→Python Interpreter”重新指定解释器，确保虚拟环境激活。
精准安装库：在PyCharm终端（Terminal）中，进入项目虚拟环境目录，执行pip install -r requirements.txt（提前整理好依赖清单），确保所有库都安装在该环境中。
AI辅助debug：当卡壳时，我会向豆包提问（比如“PyCharm无法识别虚拟环境中的库怎么办？”），它给出的“检查interpreter路径”“重建虚拟环境”等建议，帮我快速定位问题。

四、成果展示：ReAct代码跑通了！

经过一番折腾，我终于成功运行了ReAct风格的代码（以SiliconFlow API为例，模拟“观察-思考-行动”循环）：

from typing import Dict,List,Tuple
from openai import OpenAI

class BaseModel:
    def __init__(self, api_key: str = '') -> None:
        self.api_key = api_key

    def chat(self, prompt: str, history: List[Dict[str, str]], system_prompt: str = "") -> Tuple[
        str, List[Dict[str, str]]]:
        """
        基础聊天接口

        Args:
            prompt: 用户输入
            history: 对话历史
            system_prompt: 系统提示

        Returns:
            (模型响应, 更新后的对话历史)
        """
        pass


class Siliconflow(BaseModel):
    def __init__(self, api_key: str):
        self.api_key = api_key
        self.client = OpenAI(api_key=self.api_key, base_url="填自己的")

    def chat(self, prompt: str, history: List[Dict[str, str]] = [], system_prompt: str = "") -> Tuple[
        str, List[Dict[str, str]]]:
        """
        与 Siliconflow API 进行聊天

        Args:
            prompt: 用户输入
            history: 对话历史
            system_prompt: 系统提示

        Returns:
            (模型响应, 更新后的对话历史)
        """
        # 构建消息列表
        messages = [
            {"role": "system", "content": system_prompt or "You are a helpful assistant."}
        ]

        # 添加历史消息
        if history:
            messages.extend(history)

        # 添加当前用户消息
        messages.append({"role": "user", "content": prompt})

        # 调用 API
        response = self.client.chat.completions.create(
            model="Qwen/Qwen3-30B-A3B-Instruct-2507",
            messages=messages,
            temperature=0.6,
            max_tokens=2000,
        )

        model_response = response.choices[0].message.content

        # 更新对话历史
        updated_history = messages.copy()
        updated_history.append({"role": "assistant", "content": model_response})

        return model_response, updated_history
if __name__ == "__main__":
    llm = Siliconflow(api_key="填你自己的apikey")
    prompt = "你好"
    response,history  = llm.chat(prompt)
    print("Response:",response)
    print("History:",history)

运行后，控制台输出了类似这样的结果：