LangChain 入门到实战全攻略：小白也能轻松掌握

程序汪小陈

995人浏览 · 2025-08-07 12:05:15

程序汪小陈 · 2025-08-07 12:05:15 发布

在AI应用开发领域，LangChain正以每周10万+下载量的势头成为最热门框架。本文将从零开始，带你掌握如何用LangChain快速构建智能客服、论文分析、数据分析三大实用AI工具，即使没有机器学习背景也能轻松上手！

请添加图片描述

1、什么是LangChain

LangChain 诞生于 2022 年，是一个用于开发由大型语言模型（LLMs）驱动的应用程序的强大框架。

它如同 “超级胶水”，可将大型语言模型与各类外部工具、数据相连，助力开发者轻松构建复杂智能应用。

相较于普通 LLM 应用，LangChain 具备以下优势：

支持多步骤任务：可处理复杂的任务流程。
具备记忆管理能力：例如在构建聊天机器人时，能记住之前的对话内容，实现更连贯的交互。
可集成外部工具：能调用外部搜索 API 获取最新信息，以此回答问题，大大拓展语言模型的应用边界。

2、核心概念与组件

Models（模型层）：这是 LangChain 与不同大型语言模型对接的模块，无论是 OpenAI 的 GPT 系列、Anthropic 的 Claude，还是 Hugging Face 上的众多开源模型，都能通过统一的接口接入。开发者可以根据需求灵活切换模型，对比不同模型在参数（如 temperature、max_tokens 等）设置下的输出效果。比如，在创作创意写作任务时，适当提高 temperature 值（如设置为 0.8 - 1.0），可以让生成的文本更加富有创意和多样性；而在处理对准确性要求较高的任务，如法律咨询时，则可降低 temperature 值（如设置为 0.2 - 0.4），使输出更准确可靠。
Chains（任务链）：它的作用是将多个步骤串联成完整的任务流程，就像把一颗颗珠子串成一条项链。比如 SimpleSequentialChain 可以按顺序串联多个 LLM 调用，实现复杂的逻辑处理。例如，在进行数据分析时，先调用一个链对数据进行清洗，然后再调用另一个链进行统计分析，最后生成报告，每个步骤都由不同的链来完成，通过 Chains 将这些步骤有序地组织起来。开发者还可以自定义链，以满足特定业务逻辑的需求。
Agents（智能代理）：智能代理能够动态地调用各种工具，如搜索 API、数据库等，以完成复杂的任务。它就像是一个聪明的助手，能够根据任务的需要自动选择合适的工具。比如在构建一个天气查询机器人时，Agents 可以调用天气查询 API 获取实时天气信息，然后再结合语言模型生成自然流畅的回答返回给用户。它还可以使用预置工具，如 Google 搜索、Python REPL 等，为用户提供更丰富的服务。
Memory（记忆管理）：Memory 模块负责管理对话历史与上下文，使得模型在多轮对话中能够 “记住” 之前的交流内容，实现更加自然和智能的交互。例如，在聊天机器人中，使用 ConversationBufferMemory 可以记录对话历史，当用户询问 “它的价格是多少” 时，即使之前没有明确提及 “它” 具体指代什么，但如果对话历史中有相关信息，模型就能根据记忆理解用户的意图并准确回答。
Indexes（数据索引）：Indexes 主要负责连接外部数据，如本地文档（PDF/TXT 等格式）、数据库等。通过将文档加载并构建向量数据库，能够实现基于文档的高效问答系统。例如，在企业内部知识库中，员工上传的大量文档可以通过 Indexes 模块进行索引，当其他员工查询相关问题时，系统能快速检索到相关文档并给出准确回答。

3、LangChain的应用场景

一、智能问答与知识检索

利用 LangChain 连接知识库（如文档、数据库、网页等），让 LLM 基于特定领域知识回答问题，避免“幻觉”（生成错误信息）。

企业内部知识库问答：例如连接公司规章制度、产品手册等文档，员工或客户可快速查询相关信息（如“某产品的保修政策是什么？”）。
垂直领域问答系统：如医疗领域连接医学文献，为患者或医生提供疾病知识解答；法律领域结合法规库，辅助律师查询条款。
个人知识管理：整合个人笔记、邮件、电子书等，实现智能化检索和总结（如“上周会议中提到的项目截止日期是哪天？”）。

二、文本生成与创作辅助

借助 LLM 的生成能力，结合 LangChain 的工具调用和模板功能，提升文本创作效率。

内容自动化生成：自动生成新闻稿、产品描述、邮件模板、社交媒体文案等，支持根据关键词或大纲扩展内容。
写作辅助工具：为作者提供灵感、润色文字、调整文风（如从正式转为口语化），甚至生成小说情节、诗歌等创意内容。
多语言翻译与本地化：结合知识库中的专业术语库，实现精准的跨语言翻译，尤其适用于技术文档、法律文本等领域。

三、自动化工作流与任务处理

通过 LangChain 的“链（Chains）”和“代理（Agents）”功能，将 LLM 与外部工具（如API、数据库、办公软件）结合，实现复杂任务的自动化。

数据分析与报告生成：让 LLM 调用Excel、Python数据分析库（如Pandas），自动处理数据、生成可视化图表，并撰写分析报告（如“分析近3个月的销售数据并总结趋势”）。
邮件与消息自动处理：自动分类邮件、提取关键信息（如会议时间、待办事项），甚至生成回复草稿（如“自动回复客户关于订单进度的咨询”）。
日程与项目管理：结合日历工具，自动安排会议时间、提醒待办任务，或根据项目文档生成进度报告（如“汇总本周项目各模块的完成情况”）。

四、客服与用户交互优化

构建智能化的客服系统，提升用户体验和服务效率。

智能客服机器人：通过对话链（ConversationChain）实现多轮对话，理解用户意图并提供精准解答，复杂问题自动转接人工，同时记录对话历史用于优化。
用户需求挖掘：分析用户与客服的对话记录，提取高频问题、潜在需求（如“统计用户对某功能的反馈并生成改进建议”）。
个性化推荐：结合用户历史交互数据和产品知识库，为用户推荐合适的产品或服务（如“根据用户咨询的手机型号推荐配件”）。

五、教育与培训领域

辅助教学过程，提供个性化学习支持。

智能辅导系统：根据学生的学习资料（如教材、错题集），生成针对性的练习题、知识点讲解，甚至模拟答疑（如“解释微积分中的拉格朗日中值定理”）。
学习内容生成：自动生成课程大纲、课件摘要、考点总结，或根据教学目标设计案例分析题。
语言学习助手：通过对话练习、语法纠错、词汇拓展等功能，辅助用户学习外语（如“用英语模拟餐厅点餐场景并纠正语法错误”）。

六、科研与学术辅助

帮助科研人员高效处理文献、分析数据和生成成果。

文献综述与分析：批量处理学术论文，提取研究热点、方法、结论，生成综述摘要（如“总结近5年人工智能在医学影像领域的研究进展”）。
实验数据处理：调用科研工具（如MATLAB、SPSS）分析实验数据，生成结论性文本，或根据数据推测研究假设。
论文写作辅助：检查论文逻辑、优化语言表达、自动生成参考文献格式（如APA、IEEE）。

七、智能代理（AI Agents）开发

LangChain 的代理功能允许 LLM 根据目标自主决策、调用工具，实现“自主行动”。

网络信息获取与整合：代理可自动搜索网页、抓取数据（如“收集今天的股市行情并分析影响因素”），并整理成结构化报告。
代码开发辅助：代理调用代码解释器（Code Interpreter），自动编写、调试简单代码（如“用Python写一个计算斐波那契数列的函数”），或根据需求生成SQL查询语句。
生活服务代理：如自动查询天气、预订机票、规划旅行路线，甚至结合外卖API下单（如“帮我订一份附近评分最高的披萨”）。

4、Models组件

LangChain目前支持三种模型类型：LLMs、Chat Models(聊天模型)、Embeddings Models(嵌入模型）

LLMs => 大语言模型接收文本字符作为输入，返回的也是文本字符。
聊天模型 => 基于LLMs, 不同的是它接收聊天消息(一种特定格式的数据)作为输入,返回的也是聊天消息。
文本嵌入模型 => 文本嵌入模型接收文本作为输入, 返回的是浮点数列表
创建应用,得到两个KEY(API Key,Secret Key)

4.1 LLMs (大语言模型)

import os
from langchain_community.llms import QianfanLLMEndpoint
os.environ['QIANFAN_AK'] = "换成你自己的API KEY"
os.environ['QIANFAN_SK'] = "换成你自己的SECRET KEY"
llm = QianfanLLMEndpoint(model="ERNIE-Bot-turbo")
res = llm("给我讲一下小马过河的故事")
print(res)

4.2 Chat Models(聊天模型）

import os
from langchain_community.chat_models import QianfanChatEndpoint
from langchain_core.messages import HumanMessage
os.environ['QIANFAN_AK'] = "换成你自己的API KEY"
os.environ['QIANFAN_SK'] = "换成你自己的SECRET KEY"
chat = QianfanChatEndpoint(model="ERNIE-Bot-turbo")
messages = [
HumanMessage(content="给我讲一下小马过河的故事")
]
res = chat(messages)
print(res)

4.3 Embeddings Models(嵌入模型）

import os
from langchain_community.embeddings import QianfanEmbeddingsEndpoint
os.environ['QIANFAN_AK'] ="换成你自己的API KEY"
os.environ['QIANFAN_SK'] ="换成你自己的SECRET KEY"
embed = QianfanEmbeddingsEndpoint()
res1 = embed.embed_query('给我讲一下小马过河的故事')
print(res1)
# 打印结果：[0.039765920490026474, 0.02263435162603855, -0.01889650709927082,
...., ]
# res2 = embed.embed_documents(['这是第一个测试文档', '这是第二个测试文档'])
# print(res2)
# 打印结果：[[0.03977284952998161, 0.022625437006354332, -0.01892162673175335,
...., ]]

5、Prompts组件

Prompt是指当用户输入信息给模型时加入的提示，这个提示的形式可以是zero-shot或者 fewshot等方式，目的是让模型理解更为复杂的业务场景以便更好的解决问题。

提示模板：如果你有了一个起作用的提示，你可能想把它作为一个模板用于解决其他问题，LangChain就提供了PromptTemplates组件，它可以帮助你更方便的构建提示。

5.1 zero-shot提示方式

import os
from langchain_core.prompts import PromptTemplate
from langchain_community.llms import QianfanLLMEndpoint
os.environ['QIANFAN_AK'] ="换成你自己的API KEY"
os.environ['QIANFAN_SK'] ="换成你自己的SECRET KEY"
# 定义模板
template = "给我出一道关于{subject}的题目"
prompt = PromptTemplate(input_variables=["subject"], template=template)
prompt_text = prompt.format(subject="语文")
llm = QianfanLLMEndpoint()
result = llm(prompt_text)
print(result)

5.2 few-shot提示方式

import os
from langchain_core.prompts import PromptTemplate
from langchain_core.prompts import FewShotPromptTemplate
from langchain_community.llms import QianfanLLMEndpoint
os.environ['QIANFAN_AK'] = "换成你自己的API KEY"
os.environ['QIANFAN_SK'] = "换成你自己的SECRET KEY"
examples = [ {"word": "大", "antonym": "小"},
{"word": "上", "antonym": "下"},
{"word": "左", "antonym": "右"},
]
example_template = """
单词: {word}
反义词: {antonym}\\n
"""
# 实例化PromptTemplate对象
example_prompt = PromptTemplate(input_variables=["word",
"antonym"],template=example_template,)
# 实例化FewShotPromptTemplates
few_shot_prompt = FewShotPromptTemplate(
examples=examples, # 模型训练的案例
example_prompt=example_prompt, # 样例的模板
prefix="给出每个单词的反义词", # 提示的前缀
suffix="单词: {input}\\n反义词:", # 提示的后缀
input_variables=["input"], # 在few-shot当中定义的变量
example_separator="\\n", # 样例之间都使用换行进行隔开
)
# 格式化文本
prompt_text = few_shot_prompt.format(input="粗")
llm = QianfanLLMEndpoint()
print(llm(prompt_text))

6、 Chains组件

import os
from langchain_community.llms import QianfanLLMEndpoint
from langchain_core.prompts import PromptTemplate
from langchain.chains import LLMChain
os.environ['QIANFAN_AK'] = "换成你自己的API KEY"
os.environ['QIANFAN_SK'] = "换成你自己的SECRET KEY"
# 1. 定义模板
template = "给我出一道关于小学三年级{subject}的题目"
prompt = PromptTemplate(input_variables=["subject"], template=template)
# 2. 链条
llm = QianfanLLMEndpoint()
chain = LLMChain(llm=llm, prompt=prompt)
# 3. 执行Chain
result = chain.run("体育")
print(f'result-->{result}')

如果你想将第一个模型输出的结果，直接作为第二个模型的输入，还可以使用LangChain的SimpleSequentialChain, 代码如下：

import os
from langchain_core.prompts import PromptTemplate
from langchain_community.llms import QianfanLLMEndpoint
from langchain.chains import LLMChain, SimpleSequentialChain
os.environ['QIANFAN_AK'] = "换成你自己的API KEY"
os.environ['QIANFAN_SK'] = "换成你自己的SECRET KEY"
llm = QianfanLLMEndpoint()
# 创建第一条链
template = "给我出一道关于小学一年级{subject}的题目"
subject_prompt = PromptTemplate(input_variables=["subject"], template=template,
)
first_chain = LLMChain(llm=llm, prompt=subject_prompt)
# 创建第二条链
template = "给我出一道关于小学二年级{subject6}的题目"
second_prompt = PromptTemplate(input_variables=["subject6"], template=template)
second_chain = LLMChain(llm=llm, prompt=second_prompt)
# 链接两条链，verbose=True可以显示推理过程
overall_chain = SimpleSequentialChain(chains=[first_chain, second_chain],
verbose=True) # verbose=True 可以显示链条的推理过程
# 执行链，只需要传入第一个参数
catchphrase = overall_chain.run("数学")
print(catchphrase)

7、Agents组件

在 LangChain 中 Agents 的作用就是根据用户的需求，来访问一些第三方工具(比如：搜索引擎或者数据库)，进而来解决相关需求问题。

为什么要借助第三方库?

因为大模型虽然非常强大，但是也具备一定的局限性，比如不能回答实时信息、处理数学逻辑问题仍然非常的初级等等。因此，可以借助第三方工具来辅助大模型的应用。

Agent代理

制定计划和思考下一步需要采取的行动
负责控制整段代码的逻辑和执行，代理暴露了一个接口，用来接收用户输入，并返回AgentAction或AgentFinish。

Toolkit工具包

一些集成好了代理包，比如 create_csv_agent 可以使用模型解读 csv文件。

Tool工具

解决问题的工具
第三方服务的集成，比如计算器、网络搜索（谷歌、bing）等等

AgentExecutor代理执行器

它将代理和工具列表包装在一起,负责迭代运行代理的循环，直到满足停止的标准。

# 现在我们实现一个使用代理的例子：假设我们想查询一下中国目前有多少人口？我们可以使用多个代理工
具，让Agents选择执行。
# 需要安装依赖库 pip install wikipedia
# 加载内置工具 llm-math 和 wikipedia
import os
from langchain_community.llms import QianfanLLMEndpoint
from langchain.agents import load_tools, initialize_agent, AgentType
from langchain_core.prompts import PromptTemplate
os.environ['QIANFAN_AK'] = "换成你自己的API KEY"
os.environ['QIANFAN_SK'] = "换成你自己的SECRET KEY"
llm = QianfanLLMEndpoint(model="ChatGLM2-6B-32K")
tools = load_tools(["llm-math", "wikipedia"], llm=llm)
agent = initialize_agent(tools=tools,
llm=llm,
agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
verbose=True)
prompt_template = "那个国家面积最大?"
prompt = PromptTemplate.from_template(prompt_template)
result = agent.run(prompt)
print(result)

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

模型系列（篇六）-文心

2048 AI社区

项目一系列-第10章日志管理

本文介绍了日志管理的重要性和具体操作方法。日志管理在系统运维中具有定位故障、监控性能、调试代码等关键作用。在Linux环境下，可以通过docker logs命令查看容器日志，或使用exec进入容器内部查看日志文件，常用tail、grep等命令实时监控和搜索日志内容。此外，还介绍了ELK（Elasticsearch、Logstash、Kibana）日志管理平台的使用方法，包括服务启动、日志收集配置等

2048 AI社区

Agentic AI提示优化必学：提示工程架构师总结的7个“精准描述”技巧，AI不跑偏！

传统prompt是“任务指令”，而Agentic AI的prompt是智能体的“宪法”目标（Goal）：智能体要“做什么”（不是“帮我写文章”，而是“写一篇面向中级开发者的Agentic AI入门文，核心是用3个案例讲清OODA环”）；约束（Constraint）：智能体“不能做什么”（如“不能承诺未授权的退款”）；状态（State）：智能体需要“关注什么”（如“用户过去30天的浏览记录”）；行动