AI大模型从零开始系列教程（九） LangChain学习与实战(6) Agent智能体开发

接下来我们学习如何通过LangChain实现一个Agent智能体，从而让 AI 模型帮忙实现做更多事情。

菜鸟Java码农

459人浏览 · 2025-09-11 08:15:00

菜鸟Java码农 · 2025-09-11 08:15:00 发布

前面我们已经学习如何通过 Langchain调用独立部署的DeepSeek-R1:32b模型，且完成一些简单的应用，如： RAG 知识库的实现。

接下来我们学习如何通过LangChain实现一个Agent智能体，从而让 AI 模型帮忙实现做更多事情。

Agent智能体

1.1 是什么

在开发之前我们先来了解下Agent智能体是什么，它主要解决什么问题？

Agent是使用 LLM 大模型作为推理引擎的系统，用于确定应采取哪些行动(Action)以及这些行动输入应该是什么，然后会把行动的输出结果反馈给到Agent，用于判断是否需要更多行动或者结束然后输出返回。

结合网上的资料和个人理解，Agent智能体的出现主要是解决以下问题：

• LLM大模型与人类之间的交互是基于 prompt 实现的，prompt 是否清晰明确会影响大模型回答的效果
• LLM大模型只能进行推理，无法进行实际性的行动
• LLM大模型只能单独使用，无法结合多个 LLM 大模型进行组合使用
• LLM大模型只能输出文本，却无法符合用户需要的数据结构，如：如何标准的 JSON Schema
• LLM大模型只能依据当前输入进行推理，无法进行长期记忆

AI Agent是模仿人类思考技术，具体如下图所示：

一句话弄明白，就是AI大模型可以作为一个大脑进行学习推理，但是 Agent技术利用 LLM大模型的推理能力，能根据人类输入，代替人类去做一些真正想要的事情，最后输出人类真正想要结果或者去执行某些行动。

为了更好理解 Agent技术，我们可以看看目前AI协同工作类型，具体如下：

1. Embbedding 模式: 人类输入目标，AI输出几个意见，人类自主决定采用哪个意见，代表产品为: RAG 智能客服机器人
1. Copilot 模式: 人类输入目标，AI经过几个流程确定初步输出，人类可以自由调整输出，代表产品为: Copilot代码提示[2]
1. Agent 模式: 人类输入目标，AI 根据输入自主拆分任务，然后根据任务所需要的选择工具，最终完成任务最终结束，代表产品为: Manus AI 助手[3]

1.2 怎么做

上面说到Agent技术是模仿人类思考技术，利用大模型进行推理，拆分人类输入的任务，那么 Agent其实最大的重点在于激发 LLM 大模型的推理能力，去拆分人类输入的任务。

那么如何激发 LLM 大模型的推理能力呢？主要有以下几点：

1. Prompt 的思考链

思维链（Chain of Thoughts）已成为一种标准的提示技术，用于提高模型在复杂任务中的表现。模型被要求 “一步一步地思考”，将艰巨的任务分解为更小更简单的步骤。思维链将大任务转化为多个可管理的任务，并帮助人们理解模型的思维过程。

无思考链的 Prompt：

问：罗杰有5个网球，他又买了两盒网球，每盒有3个网球。他现在有多少网球？
答：答案是11
问：食堂有23个苹果，如果他们用掉20个后又买了6个。他们现在有多少个苹果？
模型输出：
答：答案是27

有思考链的 Prompt：

问：罗杰有5个网球，他又买了两盒网球，每盒有3个网球。他现在有多少网球？
答：罗杰一开始有5个网球，2盒3个网球，一共就是2*3=6个网球，5+6=11。答案是11.
问：食堂有23个苹果，如果他们用掉20个后又买了6个。他们现在有多少个苹果？
模型输出：
答：食堂原来有23个苹果，他们用掉20个，所以还有23-20=3个。他们又买了6个，所以现在有6+3=9。答案是9

PS: DeepSeek的推理模式出来后，现在大部分模型默认就支持思考链的回答了。

思维树 是思维链的另一种表现形式，通过在任务的每一步探索多种推理可能性来扩展思维链。它首先将问题分解为多个思考步骤，并在每个步骤中生成多个想法，从而创建一个树状结构。试错和纠错在现实世界的任务决策中是不可避免且至关重要的步骤。自我反思帮助 AI Agent 完善过去的行动决策、纠正以前的错误、从而不断改进。主要可以包括以下几种模式：

1. ReAct: 结合推理（Reasoning）和行动（Action），动态与环境交互。简单的理解就是: 推理+动作。
1. Reflexion: 让 AI Agent 具备动态记忆和自我反思能力以提高推理能力的框架。简单的理解就是: 重复步骤（记忆+推理+动作）。
1. Hindsight: 利用已知结果优化过去决策，从失败经验中学习。简单理解就是: 根据已知结果进行反向推理。

2. 记忆

记忆模块负责存储信息，包括过去的交互、学习到的知识，甚至是临时的任务信息。

AI有了记忆后，就可以根据已知的记忆知识去更好回答用户提问。而在 AI Agent 定义里：

用户在与其交互过程中产生的内容都可以认为是 Agent 的记忆，和人类记忆的模式能够产生对应关系。

记忆可以分为几类：

• 感觉记忆: 初始输入文本、图片等数据，如：看一张照片后，当不看照片，还能想起照片的印象，这是感觉记忆
• 短期记忆: 本次与 AI 对话的上下文，如：进行记忆几个数字，短期内还是可以记住这几个数字，这就是短期记忆
• 长期记忆: Agent在工作时需要查询向量数据库，如：学会骑自行车，及时很长时间没骑自行车，但是骑自行车这个技能还在，那么骑自行车这个技能就是长期记忆

而针对记忆这方面的技术， Embedding 技术和向量相似度计算就是记忆（向量数据库的核心），具体可以做以下理解：

• Embedding 技术：将文本、图片等数据转换为向量，从而实现记忆功能
• 向量相似度计算：通过数学方法来计算两个向量之间的相似度，常见的算法有：余弦相似度、欧式距离、汉明距离等，通过相似度计算可以判断两个向量是否相似，从而获取我们所需要的记忆数据

3. 工具

AI 懂得使用工具才会更像人类。

AI Agent 除了记忆，还需要在获取到每一步子任务的工作后，Agent 都会判断是否需要通过调用外部工具来完成该子任务，并在完成后获取该外部工具返回的信息提供给 LLM，进行下一步子任务的工作。

目前AI 大模型接入工具的使用方式如下：

1. 函数调用(Function Call): 向大模型描述函数，如：函数的作用和参数结构（如：JSON对象），从让 AI 大模型在执行任务能够调用外部工具，如：open("test.txt")
1. 插件系统(Plugin):通过标准化接口扩展大模型能力，等同于公共的函数调用，让大家都能用。
1. 模型内嵌工具: 不同模型会提供不同内置工具，如：OpenAI 的file_search和code_interpreter，能AI直接调用去搜索文件和解析文件的能力。

目前绝大部分 AI Agent开发使用的工具的方式都是 Function Call的方式，目前主流大模型基本都支持这个能力，具体如下：

模型	支持Function Call	说明
GPT-4 Turbo、GPT-4o、GPT-3.5 Turbo	是	OpenAI 系列模型，闭源
Claude 3（Opus/Sonnet/Haiku）、Claude 3.5	是	Anthropic 系列模型，闭源
Gemini Pro、Gemini 1.5 Pro、Gemini Flash	是	OpenAI 系列模型，闭源
Llama 3（8B/70B）、Llama 3.1	是	Meta Llama 系列，开源，需要微调后才支持，不过有现成的 Gorilla 微调框架
Mistral Large、Mistral-7B-Instruct	是	Mistral AI 系列，开源，轻量级模型适合本地部署
通义千问（Qwen-Chat）	是	阿里云系列，开源，基于 ReAct Prompting 原理优化工具
GLM-Z1-32B-0414、ChatGLM3-6B	是	清华智谱系列模型，开源
DeepSeek V3	是	DeepSeek，开源，专为函数调用优化，支持多工具协同

Langchain AI Agent开发实战

完整了解 Agent的知识后，解析来我们要通过Langchain框架去实现一个 AI Agent，获取获取当天的龙虎榜数据。

2.1 基础概念

• langchain_core.tools.tool: Langchain用来创建工具的方法
• langchain.agents.create_tool_calling_agent: 创建工具调用Agent的函数
• langchain.agents.AgentExecutor: 创建 Agent执行器的类

开始实现思路如下：

1. 编写工具函数和工具描述
1. 创建LLM模型
1. 创建符合工具调用Agent的Prompt
1. 创建Agent和 AgentExecutor
1. 通过LangSmith查看 Agent执行过程（调试使用）

2.2 工具声明

获取当前日期

接下来我们声明一个工具函数，用于解决大模型无法判断当前的日期。

from langchain_core.tools import tool

@tool
defget_current_day():
"""获取今天的时间"""
return date.today().strftime("%Y-%m-%d")

获取龙虎榜数据

from pydantic import BaseModel, Field

# 定义输入参数格式说明
classLhbInput(BaseModel):
    date: str = Field(description="date,  format is YYYY-MM-DD")

@tool(args_schema=LhbInput)
defget_lhb(date: str):
"""获取龙虎榜数据"""
print("开始获取%s龙虎榜" % date)
    callback = "jQuery1123029212767559503716_1747729555061"
    url = f"https://datacenter-web.eastmoney.com/api/data/v1/get?callback={callback}&sortColumns=SECURITY_CODE%2CTRADE_DATE&sortTypes=1%2C-1&pageSize=200&pageNumber=1&reportName=RPT_DAILYBILLBOARD_DETAILSNEW&columns=SECURITY_CODE%2CSECUCODE%2CSECURITY_NAME_ABBR%2CTRADE_DATE%2CEXPLAIN%2CCLOSE_PRICE%2CCHANGE_RATE%2CBILLBOARD_NET_AMT%2CBILLBOARD_BUY_AMT%2CBILLBOARD_SELL_AMT%2CBILLBOARD_DEAL_AMT%2CACCUM_AMOUNT%2CDEAL_NET_RATIO%2CDEAL_AMOUNT_RATIO%2CTURNOVERRATE%2CFREE_MARKET_CAP%2CEXPLANATION%2CD1_CLOSE_ADJCHRATE%2CD2_CLOSE_ADJCHRATE%2CD5_CLOSE_ADJCHRATE%2CD10_CLOSE_ADJCHRATE%2CSECURITY_TYPE_CODE&source=WEB&client=WEB&filter=%28TRADE_DATE%3C%3D%27{date}%27%29%28TRADE_DATE%3E%3D%27{date}%27%29"
    response = requests.get(url)
    content = response.content.decode("utf-8")
    content = content.split(callback + "(")[1].split(");")[0]
return json.loads(content).get("result")

2.3 创建LLM模型

不同的模型对于工具调用不同，目前已知支持最好的模型是GPT-4 Turbo，但是这个模型是闭源的，国内支持较好是 DeepSeek但是也收费，对于调试模型更加友好可以利用g模型厂商 - siliconflow AI 云服务平台[4]，从而减少我们的调试成本。

from langchain_openai import ChatOpenAI

api_key = "xxxxxx"
llm = ChatOpenAI(
    base_url="https://api.siliconflow.cn",
    model="Qwen/Qwen3-235B-A22B", # 这里可以更换不同模型 更好的达到实现效果
    api_key=api_key
)

2.4 创建Prompt

Prompt对于LLM大模型的实现有关键作用，其中agent_scratchpad的占位符对于 AI 大模型实现非常重要，主要用于记录和传递 Agent 执行过程中的中间推理步骤，同时还会强制按照 tool所需要的参数进行输入调用。

Prompt 具体实现如下：

from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder

#
prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "你是人工智能助手"),
        MessagesPlaceholder(variable_name="agent_scratchpad"),
        ("human", "{input}"),
    ]
)

2.5 创建Agent和 AgentExecutor

创建Agent, Langchain也提供不同的类型，如下：

• Tool Calling Agent (create_tool_calling_agent) ：依赖模型原生工具调用能力，自动将工具描述注入模型上下文，直接返回工具调用参数对象，部分LLM模型支持
• ReAct Agent (create_react_agent) ：遵循 Thought → Action → Observation 循环，每步根据上下文选择工具，结合自然语言与工具调用
• Structured Chat Agent (create_structured_chat_agent)：必须遵循预定义响应模板，严格匹配工具参数格式，通常一次性完成工具选择

目前我们使用的是 create_tool_calling_agent，具体实现如下：

from langchain.agents import create_tool_calling_agent, AgentExecutor

tools = [get_current_day, get_lhb]

agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    handle_parsing_errors=True,
    verbose=True, format="json"
)

# 调用
print(agent_executor.invoke({"input": "帮我查询一下今天的龙虎榜数据"}))

PS:

• handle_parsing_errors: 当 Agent执行发生异常的时候，如传入参数不符合工具描述，是否抛出异常，当为 True错误信息会通过 intermediate_steps 传递到下一轮推理，模型基于历史步骤中的错误反馈重新生成正确的工具调用指令
• verbose: 是否打印中间步骤，从而更好的理解模型推理过程

以下是完整代码实现过程截图：

2.6 Smith调试

在 Agent中避免不了调试，尤其不同大模型对于工具的调用和判断是不一样的，同时执行过程异常 Langchain也比较难定位，所以因此我们可以使用LangSmith进行调试。

前往LangSmith[5]官网，注册账号，创建项目，获取API_KEY，设置环境变量，具体如下：

# 设置LangSimth 环境变量
os.environ["LANGSMITH_TRACING"] = "true"
os.environ["LANGSMITH_ENDPOINT"] = "https://api.smith.langchain.com"
os.environ["LANGSMITH_API_KEY"] = "<LANGSMITH_API_KEY>"
os.environ["LANGSMITH_PROJECT"] = "test_agent"

再次运行Agent，可以前往LangSmith[6]查看调试结果，如下图所示：

3.总结

AI Agent的实现，对于我们来说，可以更好的理解大模型的能力，同时也可以更好的利用大模型能力，从而更好的实现业务场景。回顾一下，AI Agent的知识点：

1. AI Agent是利用 AI 大模型的推理能力，结合记忆+工具调用能力，实现扩展 AI 大模型能力的一种技术方案
1. 实现 AI Agent的方案有目前主流是通过大模型 Function Call
1. 实现 AI Agent中的 Prompt中，agent_scratchpad占位符是非常重要，记录和传递 Agent 执行过程中的中间推理步骤，同时还会强制按照 tool 所需要的参数进行输入调用。

以上就是 AI Agent的实现过程，希望对你有所帮助。

学习累了，玩个小游戏放松一下大脑。

大模型算是目前当之无愧最火的一个方向了，算是新时代的风口！有小伙伴觉得，作为新领域、新方向人才需求必然相当大，与之相应的人才缺乏、人才竞争自然也会更少，那转行去做大模型是不是一个更好的选择呢？是不是更好就业呢？是不是就暂时能抵抗35岁中年危机呢？

答案当然是这样，大模型必然是新风口！

那如何学习大模型？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。但是具体到个人，只能说是：

最先掌握AI的人，将会比较晚掌握AI的人有竞争优势。
这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

但现在很多想入行大模型的人苦于现在网上的大模型老课程老教材，学也不是不学也不是，基于此我用做产品的心态来打磨这份大模型教程，深挖痛点并持续修改了近100余次后，终于把整个AI大模型的学习路线完善出来！

在这里插入图片描述

在这个版本当中：

您只需要听我讲，跟着我做即可，为了让学习的道路变得更简单，这份大模型路线+学习教程已经给大家整理并打包分享出来, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型学习资源包》免费分享（安全咨料，放心领取）👈

一、大模型经典书籍（免费分享）

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套大模型报告（免费分享）

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、大模型系列视频教程（免费分享）

在这里插入图片描述

四、2025最新大模型学习路线（免费分享）

我们把学习路线分成L1到L4四个阶段，一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：了解大模型的基础知识，以及大模型在各个行业的应用和分析，学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段：AI大模型RAG应用开发工程，主要学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，主要学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调，并通过Ollama、vLLM等推理部署框架，实现模型的快速部署。

L5阶段：专题集丨特训篇【录播课】

全套的AI大模型学习资源已经整理打包，有需要的小伙伴可以微信扫描下方二维码，免费领取

👉CSDN大礼包🎁：全网最全《LLM大模型学习资源包》免费分享（安全资料，放心领取）👈

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

SPI设备驱动

申请或者定义一个spi_driver，然后初始化spi_driver中的各个成员变量，当SPI设备和驱动匹配以后，spi_driver下的probe函数就会执行！构建spi_transfer，然后将其打包到spi_message里面，需要使用spi_message_init初始化spi_message，然后在使用spi_message_add_tail将spi_transfer添加到spi_me

2048 AI社区

【源码解析：memcpy、memmove、memset】

这段代码是GNU C库中用于内存安全操作的宏定义，主要功能是防止缓冲区溢出。它通过__ssp_bos_check3宏将标准内存操作函数（memcpy、memmove、memset）重定向到带有安全检查的版本。该机制会在编译时检测目标缓冲区大小，在运行时验证操作长度，若发现溢出则终止程序。在嵌入式开发中，这些函数常用于结构体复制、数据初始化、协议处理等场景，特别适合对安全性要求高的应用。通过条件编译