LangChain Agent 调用工具的实现原理揭秘

本文解析了Agent如何通过ReAct模式自主调用list_repository_files工具获取GitHub仓库信息。该过程包含四个角色：用户提出问题、LLM（Google Gemini）进行推理、工具执行代码、AgentExecutor协调交互。流程分为三个阶段：1）LLM分析问题并生成指令；2）AgentExecutor拦截指令并调用工具执行；3）将结果反馈给LLM生成最终答案。代码实现体

nvd11

283人浏览 · 2025-11-29 21:55:26

nvd11 · 2025-11-29 21:55:26 发布

本文档详细解析了在本项目中，Agent 是如何“自主”决定并调用 list_repository_files 工具来获取 GitHub 仓库信息的。这背后的魔法实际上是一个严密的逻辑循环，被称为 ReAct (Reason + Act) 模式。

1. 核心角色

在这一出戏中，有四个主要角色：

用户 (User): 提出问题（例如：“列出 nvd11/py-github-agent 的文件”）。
大脑 (LLM): 这里是 Google Gemini。它负责理解意图、进行推理、并生成行动指令。它不能直接运行代码。
手臂 (Tool): 这里是 list_repository_files 函数。它是实际执行 Python 代码、调用 GitHub API 的部分。
导演 (AgentExecutor): 这是 LangChain 的运行时环境。它负责协调大脑和手臂，在一个循环中传递信息。

2. 流程图解 (Mermaid)

以下流程图展示了 Agent 从接收问题到返回答案的完整交互过程：

3. 执行流程详解 (The Loop)

当您发起请求时，以下循环开始运转：

第一阶段：思考与决策 (Reasoning)

输入: 用户问题 + 工具说明书 + 格式指南 -> 发送给 LLM。
LLM 思考: LLM 分析问题，发现自己不知道仓库里有什么文件，但看到有一个工具可以做这件事。

LLM 输出:

Thought: 用户想要仓库文件列表，我应该使用 list_repository_files 工具。
Action: list_repository_files
Action Input: {"repo_owner": "nvd11", "repo_name": "py-github-agent"}

(此时，LLM 停止生成，因为它在等待工具的结果)

第二阶段：拦截与行动 (Acting)

拦截: AgentExecutor 一直在监控 LLM 的输出。一旦它解析出 Action 和 Action Input，它就暂停与 LLM 的交互。
执行: AgentExecutor 在本地 Python 环境中找到对应的函数 list_repository_files，并将参数传入执行。
获取结果: 工具运行完毕，返回一个列表：['README.md', 'Dockerfile', ...]。

第三阶段：观察与回答 (Observation & Response)

构造新 Prompt: AgentExecutor 将工具的返回结果标记为 Observation，拼接到之前的对话后面：

... (之前的对话)
Action Input: {"repo_owner": "nvd11", "repo_name": "py-github-agent"}
Observation: ['README.md', 'Dockerfile', ...]
Thought:

再次调用 LLM: 将这个包含结果的新 Prompt 发送给 LLM。
LLM 总结: LLM 看到 Observation 后，知道任务已完成。

LLM 输出:

Thought: 我已经拿到了文件列表。
Final Answer: 该仓库包含以下文件：README.md, Dockerfile...

第四阶段：结束

返回: AgentExecutor 检测到 Final Answer，结束循环，将最终答案返回给用户。

4. 代码映射

在我们的代码中，这些步骤体现在：

工具定义 (src/tools/github_tools.py): 定义了“手臂”的能力和说明书。
Agent 定义 (src/agents/github_agent.py): 将 LLM 和工具组装在一起，并加载了 ReAct Prompt 模板。
执行 (src/services/llm_service.py): 启动 AgentExecutor，驱动整个循环。

这就是“魔法”的全部真相：通过精妙的 Prompt 设计，让 LLM 学会按照我们的格式发号施令，再由程序替它跑腿执行。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

DAY 21 推断聚类后簇的类型

零基础先掌握「先选特征」思路，因为它依赖业务经验，步骤简单，解读直接。两种思路的核心都是「通过簇内特征的统计值（均值）结合业务逻辑解读」，区别只是 “选特征的时机”。代码可以直接复制运行，遇到报错先看 “常见错误 & 解决方案”，再不行就检查库是否安装（Mac OS 终端运行pip list查看）。通过可视化图形借助 ai 定义簇的含义下面通过4 类核心可视化图形（PCA 降维散点图、簇特征热力图