AI Agent开发从0到1：基于LangChain搭建具备多任务能力的智能助手

本文介绍了基于LangChain框架开发多任务AIAgent的方法。首先阐述了AIAgent与传统大模型应用的区别，以及LangChain作为开发框架的优势。然后详细讲解了环境搭建步骤，包括安装依赖、配置API密钥和验证环境。文章重点关注LangChain的四个核心组件：大语言模型（LLM）、工具（Tools）、记忆（Memory）和代理（Agent），并提供了一个完整的实战案例，演示如何构建一个

zlb147369

760人浏览 · 2025-11-18 08:03:20

zlb147369 · 2025-11-18 08:03:20 发布

一、前置认知：AI Agent与LangChain核心概念

在动手开发前，我们先明确两个核心概念，避免后续开发中“知其然不知其所以然”。

1.1 什么是具备多任务能力的AI Agent？

传统大模型应用多是“一问一答”的被动交互，而AI Agent具备自主决策能力：面对“整理近3年Python热门库并生成对比表格”这类复杂任务，它能拆解为“搜索热门库列表→收集各库核心特性→整理为表格”等子步骤，自动调用搜索工具、数据处理工具完成任务，无需人工干预。

多任务能力则意味着Agent能适配不同场景，如信息检索、数据处理、文档分析等，而非局限于单一功能。

1.2 LangChain为何是搭建Agent的首选？

LangChain不是大模型，而是一个“大模型应用开发框架”，其核心优势在于组件化和可扩展性，刚好契合AI Agent的开发需求：

模型集成：统一封装OpenAI、 Claude、国产大模型等接口，切换模型无需修改核心代码；

工具调用：内置数百种工具（搜索、数据库、文件操作等），支持自定义工具，满足多任务需求；

记忆机制：提供会话记忆、长期记忆等组件，让Agent能记住上下文信息；

规划能力：通过Chain（链）、Agent（代理）等模块，实现任务拆解和步骤规划。

二、环境搭建：3步完成开发准备

本案例基于Python 3.9+开发，需准备大模型API（以OpenAI为例，也可替换为百度文心、阿里通义等国产模型）和工具API（以搜索工具SerpAPI为例）。

2.1 安装核心依赖

打开终端执行以下命令，安装LangChain及相关依赖：

bash
# 安装LangChain核心库
pip install langchain
# 安装OpenAI SDK（用于调用大模型）
pip install openai
# 安装搜索工具依赖（用于调用SerpAPI）
pip install google-search-results
# 安装环境变量管理工具（可选，方便管理API密钥）
pip install python-dotenv

2.2 配置API密钥

为避免代码中硬编码密钥，推荐使用.env文件管理：

在项目根目录创建.env文件，写入以下内容（需替换为自己的密钥）：

env
# OpenAI API密钥（从https://platform.openai.com获取）
OPENAI_API_KEY="sk-xxxxxx"
# SerpAPI密钥（从https://serpapi.com获取，用于搜索功能）
SERPAPI_API_KEY="xxxxxx"

在代码中加载环境变量：

python
from dotenv import load_dotenv
import os

# 加载.env文件中的环境变量
load_dotenv()
# 获取API密钥
openai_api_key = os.getenv("OPENAI_API_KEY")
serpapi_api_key = os.getenv("SERPAPI_API_KEY")

2.3 验证环境是否可用

编写简单测试代码，调用OpenAI模型验证连接：

python
from langchain.llms import OpenAI

# 初始化大模型
llm = OpenAI(
    model_name="gpt-3.5-turbo-instruct", # 轻量且性价比高的模型
    api_key=openai_api_key,
    temperature=0.7 # 创造性适中，0为最严谨，1为最有创造性
)

# 测试生成内容
result = llm.generate(["用一句话介绍LangChain"])
print(result.generations[0][0].text)

运行代码若输出类似“LangChain是一个用于构建大模型应用的开源框架，提供组件化工具支持任务拆解、工具调用和记忆管理”，则环境搭建成功。

三、核心组件解析：搭建Agent的“积木”

AI Agent的核心是“感知-规划-执行-记忆”闭环，LangChain的组件恰好对应这一闭环。我们重点关注以下4个核心组件：

3.1 大语言模型（LLM）：Agent的“大脑”

LLM是Agent的决策核心，负责理解任务、规划步骤、生成工具调用指令。LangChain支持“基础LLM”（如gpt-3.5-turbo-instruct）和“聊天模型”（如gpt-3.5-turbo），聊天模型更适合对话场景，本文使用聊天模型：

python
from langchain.chat_models import ChatOpenAI

# 初始化聊天模型
chat_llm = ChatOpenAI(
    model_name="gpt-3.5-turbo",
    api_key=openai_api_key,
    temperature=0.5
)

3.2 工具（Tools）：Agent的“手脚”

Agent通过工具与外部世界交互（如搜索、操作文件）。LangChain内置大量工具，本文以“搜索工具（SerpAPI）”和“Python代码执行工具（PythonREPL）”为例，前者用于获取实时信息，后者用于数据处理。

python
from langchain.tools import SerpAPIWrapper, PythonREPLTool

# 初始化搜索工具
search_tool = SerpAPIWrapper(serpapi_api_key=serpapi_api_key)
# 初始化Python代码执行工具（用于数据处理、生成表格等）
python_repl_tool = PythonREPLTool()

# 工具列表（后续传入Agent）
tools = [
    {
        "name": "search",
        "description": "用于获取实时信息、最新数据，如热门库排名、行业动态等",
        "func": search_tool.run
    },
    {
        "name": "python_repl",
        "description": "用于执行Python代码，处理数据、生成文件（如Excel表格、图表）等",
        "func": python_repl_tool.run
    }
]

3.3 记忆（Memory）：Agent的“记忆”

记忆组件让Agent能记住对话历史和任务中间结果，避免重复操作。本文使用“对话缓冲记忆”（ConversationBufferMemory），适用于简单多轮对话：

python
from langchain.memory import ConversationBufferMemory

# 初始化记忆组件，指定记忆键为"chat_history"
memory = ConversationBufferMemory(
memory_key="chat_history",
return_messages=True # 返回消息对象，更易处理
)

3.4 代理（Agent）：组件的“粘合剂”

Agent负责协调LLM、工具和记忆：接收任务后，让LLM分析任务→规划步骤→调用工具→根据结果调整策略。LangChain提供多种Agent类型，本文使用“ReAct Agent”（基于“思考-行动-观察”循环，适合工具调用场景）。

四、实战开发：搭建多任务AI Agent

结合以上组件，我们搭建一个能完成“信息检索→数据处理→结果输出”全流程的Agent，以“整理2023-2025年Python热门数据处理库，生成对比表格并保存为Excel”为例演示。

4.1 完整代码实现

python
from dotenv import load_dotenv
import os
from langchain.chat_models import ChatOpenAI
from langchain.tools import SerpAPIWrapper, PythonREPLTool
from langchain.memory import ConversationBufferMemory
from langchain.agents import initialize_agent, AgentType

# 1. 加载环境变量和初始化组件
load_dotenv()
openai_api_key = os.getenv("OPENAI_API_KEY")
serpapi_api_key = os.getenv("SERPAPI_API_KEY")

# 初始化大模型
chat_llm = ChatOpenAI(
    model_name="gpt-3.5-turbo",
    api_key=openai_api_key,
    temperature=0.5
)

# 初始化工具
search_tool = SerpAPIWrapper(serpapi_api_key=serpapi_api_key)
python_repl_tool = PythonREPLTool()
tools = [
    {
        "name": "Search",
        "description": "获取2023-2025年Python数据处理库的热门排名、核心特性、更新日志等实时信息",
        "func": search_tool.run
    },
    {
        "name": "Python_REPL",
        "description": "用pandas处理数据、生成对比表格，并用openpyxl保存为Excel文件",
        "func": python_repl_tool.run
    }
]

# 初始化记忆
memory = ConversationBufferMemory(
    memory_key="chat_history",
    return_messages=True,
    output_key="output" # 与Agent输出键对应
)

# 2. 初始化Agent
agent = initialize_agent(
    tools=tools,
    llm=chat_llm,
    agent=AgentType.CHAT_CONVERSATIONAL_REACT_DESCRIPTION, # ReAct风格的聊天Agent
    memory=memory,
    verbose=True, # 打印详细流程（调试用）
    return_intermediate_steps=True, # 返回中间步骤（可选）
    handle_parsing_errors=True # 处理解析错误
)

# 3. 执行任务
task = "整理2023-2025年Python热门数据处理库，要求：1. 筛选Top5热门库；2. 对比核心特性、适用场景、性能优势；3. 生成Excel表格保存到当前目录，文件名'python_data_libs_2023_2025.xlsx'"
result = agent({"input": task})

# 4. 输出结果
print("任务执行完成！")
print("最终结果：", result["output"])

4.2 关键代码解析

Agent类型选择：选用CHAT_CONVERSATIONAL_REACT_DESCRIPTION，兼顾聊天交互和工具调用能力，会输出“思考过程”（如“我需要先搜索Top5库”），便于调试。

工具描述优化：工具的description必须精准，LLM会根据描述判断是否调用该工具。例如给搜索工具限定“2023-2025年数据处理库”，避免搜索无关信息。

记忆配置：指定output_key="output"，确保记忆能正确存储Agent的输出结果，支持多轮对话（如后续可问“修改表格格式”，Agent会记住之前的表格内容）。

4.3 运行效果演示

运行代码后，终端会打印Agent的执行流程：

text
> Entering new AgentExecutor chain...
Thought: 我需要先搜索2023-2025年Python热门数据处理库的Top5，获取各库信息后用pandas生成表格。
Action:
{
  "name": "Search",
  "parameters": {
    "query": "2023-2025 Python 热门数据处理库 Top5 核心特性适用场景性能"
  }
}
...（搜索结果返回）
Thought: 已获取Top5库：pandas、Polars、Dask、Vaex、PySpark。接下来用Python_REPL生成表格。
Action:
{
  "name": "Python_REPL",
  "parameters": {
    "query": "import pandas as pd\n# 构造数据\n数据 = {\n    '库名': ['pandas', 'Polars', 'Dask', 'Vaex', 'PySpark'],\n    '核心特性': ['成熟稳定，API丰富', 'Rust编写，速度快', '分布式计算', '内存映射，大文件处理', '大数据集群计算'],\n    '适用场景': ['中小规模数据', '实时数据处理', '大规模分布式数据', '单节点大文件', '企业级大数据'],\n    '性能优势': ['兼容性强', '比pandas快5-10倍', '支持TB级数据', '低内存占用', '高并发处理']\n}\ndf = pd.DataFrame(数据)\n# 保存为Excel\ndf.to_excel('python_data_libs_2023_2025.xlsx', index=False)\nprint('表格生成成功！')"
  }
}
...（代码执行完成）
Thought: 任务已完成，生成Excel表格保存到当前目录。
Final Answer: 2023-2025年Python热门数据处理库Top5对比表格已生成，文件名：python_data_libs_2023_2025.xlsx，包含核心特性、适用场景、性能优势等信息。

任务执行完成！
最终结果：2023-2025年Python热门数据处理库Top5对比表格已生成...

此时当前目录会出现对应的Excel文件，完成多任务闭环。

五、优化方向：让Agent更智能

基础版本的Agent已能完成多任务，但在复杂场景下仍需优化，推荐以下3个方向：

5.1 优化Prompt：提升决策准确性

通过自定义Prompt模板，给Agent更清晰的指令。例如限定“若搜索结果不明确，需补充搜索关键词，而非猜测”：

python
from langchain.prompts import ChatPromptTemplate

# 自定义Prompt模板
prompt_template = ChatPromptTemplate.from_messages([
    ("system", "你是一个专业的数据处理助手，遵循以下规则：1. 搜索时若结果模糊，需补充关键词重新搜索；2. 生成表格时需验证数据准确性；3. 遇到错误需告知用户并重试。"),
    ("human", "{input}"),
    ("ai", "{chat_history}")
])

# 初始化Agent时传入自定义Prompt
agent = initialize_agent(
    tools=tools,
    llm=chat_llm,
    agent=AgentType.CHAT_CONVERSATIONAL_REACT_DESCRIPTION,
    memory=memory,
    verbose=True,
    prompt=prompt_template # 传入自定义Prompt
)

5.2 扩展工具：适配更多场景

根据需求添加自定义工具，例如：

文档处理工具：集成PyPDF2，让Agent能解析PDF中的数据；

数据库工具：集成SQLAlchemy，让Agent能直接操作MySQL、PostgreSQL等数据库；

邮件工具：集成smtplib，让Agent完成表格后自动发送邮件。

5.3 升级记忆：支持长期任务

基础记忆仅能存储对话历史，对于“持续跟踪每周Python库更新”这类长期任务，需使用“向量数据库记忆”（如Pinecone），实现记忆的持久化和高效检索。

六、总结与展望

本文通过LangChain实现了一个具备“搜索-处理-输出”能力的多任务AI Agent，核心是利用LangChain的组件化优势，快速整合LLM、工具和记忆。从开发流程来看，搭建Agent的关键是“明确任务场景→选择合适组件→优化工具和Prompt”。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Harness Engineering：面向Agent-First世界的软件工程范式重构

2048 AI社区

被战争部点名的Anthropic，如何成长为硅谷大模型第三极？

Amodei明确拒绝，称即使在美国国防部施压的情况下，也不会移除其前沿 AI模型Claude的安全措施。今年2月Amodei还在接受播客采访时说，它们早在2022 年就有一个早期版本的 Claude 1，早于 ChatGPT的发布，但他们选择当时不公开发布，因为担心会"引发军备竞赛，没有足够时间安全地构建这些系统"。去年DeepSeek狂潮席卷全球，面对开源冲击，Dario Amodei在个人博客