大模型开发实战：（六）在 LangGraph 中使用 MCP 协议，大模型入门到精通，收藏这篇就足够了！

MCP（Model Context Protocol，模型上下文协议）是一种专为大语言模型设计的开源通信协议，使用 MCP 可以标准化模型与外部数据源、工具或服务之间的交互。也就是说通过 MCP 协议，可以使模型具备调用外部工具的能力，比如获取数据、执行外部操作等。

程序学到昏

766人浏览 · 2025-09-10 10:39:39

程序学到昏 · 2025-09-10 10:39:39 发布

什么是 MCP 协议

MCP 协议与 API 调用的区别

到这里，可能不少同学会有疑问，MCP 协议听起来和 API 调用差不多，就算不使用 MCP 协议，也可以通过 API 调用来实现模型与外部数据源、工具或服务之间的交互。MCP 协议的意义在于为不同的 API 创建了一个通用标准，就像 USB-C 让不同设备能够通过相同的接口连接一样。

与 API 调用相比，MCP 协议具有一些特性：

上下文感知与会话状态管理：MCP 协议允许模型在多个请求之间保持上下文感知和会话状态管理。这意味着模型可以记住之前的对话历史、用户偏好和其他相关信息，从而提供更个性化和上下文相关的响应。API 调用通常是无状态的，每个请求都是独立的，模型无法记住之前的对话历史或上下文信息。例如，用户问“我的快递到哪了？”，MCP 会自动关联历史订单信息并返回物流状态，无需用户重复提供订单号。而 API 调用需要手动提供订单号才能查询物流状态。
双向实时通信：MCP 协议支持双向实时通信，允许模型和外部服务之间进行实时交互。这使得模型能够在需要时主动请求信息或执行操作，而不仅仅是被动响应请求。API 调用通常是单向的，模型只能在接收到请求时进行响应。例如，MCP 服务在处理复杂任务时，可主动反馈中间结果（如“正在查询数据库，请稍候”）。
动态工具发现与集成：MCP 协议允许模型动态发现和集成新的工具或服务，而无需修改代码或重新部署。这使得模型能够灵活地适应新的需求和环境。API 调用通常是静态的，模型只能使用预先定义的 API 接口。例如，用户问“帮我订机票”，MCP 会自动识别可用的航班查询工具和支付接口，无需提前配置。而 API 调用需要单独开发调用机票查询和支付的接口。

MCP 协议的连接方式

MCP 协议通常使用两种方式建立连接。

SSE（Server-Sent Events）

SSE 是一种基于 HTTP 的通信协议，它使用单向连接，从 MCP 服务端到客户端发送数据流。SSE 适用于需要实时更新的场景，例如聊天应用、股票行情等。在通过 SSE 连接时，你会用到类似 http://localhost:8001/sse 的 URL 地址，因此 SSE 连接更像传统的网络 API 调用。

stdio（标准输入输出）

stdio 通过标准输入输出流进行通信，通常 MCP 服务端是运行在本地的，适用于本地开发和调试。

在 LangGraph 中使用 MCP 协议

下面通过一个最简单的实例来演示如何在 LangGraph 中使用 MCP 协议。项目文件结构如下：

.
├── mcp_servers  # MCP 服务器
│   ├── math.py     # 数学计算
│   └── weather.py  # 天气查询
└── main.py      # 主程序

首先安装所需要的包。

pip install langchain-mcp-adapters mcp

然后在 mcp_servers 目录下创建两个 MCP 服务。math.py 使用 stdio 连接，实现了加法和乘法运算，用于解决数学计算问题。weather.py 使用 SSE 连接，实现了天气和时间查询功能。

math.py 代码如下：

from mcp.server.fastmcp import FastMCP

mcp = FastMCP("Math")

@mcp.tool()
defadd(a: int, b: int) -> int:
return a + b

@mcp.tool()
defmultiply(a: int, b: int) -> int:
return a * b

if __name__ == "__main__":
    mcp.run(transport="stdio")

weather.py 代码如下：

from datetime import datetime
from mcp.server.fastmcp import FastMCP

mcp = FastMCP("Weather", port=8001)

@mcp.tool()
defget_weather(location: str) -> str:
return"晴天"

@mcp.tool()
defget_time() -> str:
return datetime.now().strftime('%Y-%m-%d %H:%M:%S')

if __name__ == "__main__":
    mcp.run(transport="sse")

接着在 main.py 中引用相关的包。

import asyncio
from contextlib import asynccontextmanager
from typing import Annotated, TypedDict

from langchain.prompts import ChatPromptTemplate
from langchain_mcp_adapters.client import MultiServerMCPClient
from langgraph.graph import END, START, StateGraph
from langgraph.graph.message import add_messages
from langgraph.prebuilt import ToolNode, tools_condition
from langchain_ollama import ChatOllama

编写 load_mcp_tools() 方法，将 MCP 服务转换成 LangChain 中的工具（langchain_core.tools）。

@asynccontextmanager
asyncdefload_mcp_tools():
"""加载 MCP 工具"""
asyncwith MultiServerMCPClient(
        {
"math": {
"command": "python",
"args": ["mcp_servers/math.py"],
"transport": "stdio",
            },
"weather": {
"url": f"http://localhost:8001/sse",
"transport": "sse",
            }
        }
    ) as client:
yield client.get_tools()

加载模型、设置提示词以及定义 LangGraph 图的状态。

model = ChatOllama(model="qwen2.5:7b")
prompt = ChatPromptTemplate.from_template("You are an assistant for question-answering tasks. If necessary, external tools can also be called to answer. If you don't know the answer, just say that you don't know. Answer in Chinese.\n\nQuestion: {question}")

classState(TypedDict):
    messages: Annotated[list, add_messages]

编写 create_graph() 方法，创建一个最简单的图，仅包含一个对话节点和一个工具节点。在 LangGraph 中调用工具，需要将工具转换成工具节点 ToolNode，工具节点会自动处理工具的调用和结果的返回。

@asynccontextmanager
asyncdefcreate_graph():
"""创建图"""
defagent(state: State):
        messages = state["messages"]
        state["messages"] = llm_with_tool.invoke(messages)
return state

asyncwith load_mcp_tools() as tools:   # 获取 MCP 工具
        print(f"可用的 MCP 工具：{[tool.name for tool in tools]}")
        llm_with_tool = prompt | model.bind_tools(tools)    # 绑定工具并创建模型调用链

        graph_builder = StateGraph(State)
        graph_builder.add_node(agent)
# 添加工具节点
        graph_builder.add_node("tool", ToolNode(tools))
        graph_builder.add_edge(START, "agent")
        graph_builder.add_conditional_edges(
"agent",
            tools_condition,    # LangGraph 中预定义的方法，用于判断是否需要调用工具
            {
"tools": "tool",
                END: END,
            },
        )
        graph_builder.add_edge("tool", "agent")

yield graph_builder.compile()

最后编写主程序，运行观察一下结果。

asyncdefmain():
asyncwith create_graph() as graph:
        result = await graph.ainvoke({"messages": "徐州天气怎么样"})
        print(result["messages"][-1].content)
        result = await graph.ainvoke({"messages": "现在几点了"})
        print(result["messages"][-1].content)
        result = await graph.ainvoke({"messages": "(3+5)x12等于多少"})
        print(result["messages"][-1].content)

if __name__ == "__main__":
    asyncio.run(main())

可以看到输出结果如下：

可用的 MCP 工具：['add', 'multiply', 'get_weather', 'get_time']
徐州现在的天气是晴天。
现在的时刻是17:22:15。
(3+5)×12等于96。

大模型算是目前当之无愧最火的一个方向了，算是新时代的风口！有小伙伴觉得，作为新领域、新方向人才需求必然相当大，与之相应的人才缺乏、人才竞争自然也会更少，那转行去做大模型是不是一个更好的选择呢？是不是更好就业呢？是不是就暂时能抵抗35岁中年危机呢？

答案当然是这样，大模型必然是新风口！

那如何学习大模型？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。但是具体到个人，只能说是：

最先掌握AI的人，将会比较晚掌握AI的人有竞争优势。
这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

但现在很多想入行大模型的人苦于现在网上的大模型老课程老教材，学也不是不学也不是，基于此我用做产品的心态来打磨这份大模型教程，深挖痛点并持续修改了近100余次后，终于把整个AI大模型的学习路线完善出来！

在这里插入图片描述

在这个版本当中：

您只需要听我讲，跟着我做即可，为了让学习的道路变得更简单，这份大模型路线+学习教程已经给大家整理并打包分享出来, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型学习资源包》免费分享（安全咨料，放心领取）👈

一、大模型经典书籍（免费分享）

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套大模型报告（免费分享）

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、大模型系列视频教程（免费分享）

在这里插入图片描述

四、2025最新大模型学习路线（免费分享）

我们把学习路线分成L1到L4四个阶段，一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：了解大模型的基础知识，以及大模型在各个行业的应用和分析，学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段：AI大模型RAG应用开发工程，主要学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，主要学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调，并通过Ollama、vLLM等推理部署框架，实现模型的快速部署。

L5阶段：专题集丨特训篇【录播课】

全套的AI大模型学习资源已经整理打包，有需要的小伙伴可以微信扫描下方二维码，免费领取

👉CSDN大礼包🎁：全网最全《LLM大模型学习资源包》免费分享（安全资料，放心领取）👈

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Java Web 微信跳蚤市场设计与实现（微信端）系统源码-SpringBoot2+微信小程序+MyBatis+MySQL8【含文档】

2048 AI社区

从零开始复现小智AI 03

本次复现花费了大量的时间，其中大多数时间花费在链接小智设备和分页查询过滤的设计阶段，代码本身难度不大，在aop上走的弯路过多，最终效果实现了，却发现可能占用太多的内存，于是放弃aop的方案。不过这也使我写代码的能力得到了一点点的提升。复现的路途还有很长，我的技术也还很菜，继续加油吧！

2048 AI社区

Transformer vs. Diffusion：谁将主宰通用视频生成与世界模型的未来？

摘要： OpenAI的Sora模型标志着视频生成技术的范式转变，从基于U-Net的经典Diffusion架构转向以Transformer为核心的Diffusion Transformer（DiT）。对比显示，Transformer在全局建模、长序列处理、可扩展性和组合性上具有显著优势，能够统一处理不同分辨率、时长的视频，并涌现出接近物理规律的生成能力。这种架构更接近通用视频生成和世界模型的需求，支