MCP工作原理

第N次重构

801人浏览 · 2026-02-02 08:57:54

第N次重构 · 2026-02-02 08:57:54 发布

什么是MCP?

简单来说，MCP 就是 AI 时代的 USB-C 接口。在过去，每个 AI 模型要连接 GitHub、Slack 或本地文件，都需要单独写适配器，这是极其低效的 "M 乘 N" 问题。MCP 提供了一套开放标准，让开发者只需写一次 Server，就能被 Claude、Zed 编辑器等任何支持 MCP 的 Client 调用。它不仅统一了接口，还确保了数据主要停留在本地，解决了我们最关心的安全和隐私问题。

AI应用的通用标准：像USB-C接口一样，标准化连接AI模型与数据源（如Google Drive、Github）。

解耦模型与工具：开发者只需构建一次Server，即可被Claude、IDE等多种Client复用告别m×n适配。

安全可控的上下文：基于本地优先架构，数据不离开本地环境，仅按需向模型提供必要的上下文。

一、MCP核心架构

这张核心架构图。MCP 采用了经典的三层结构：最上层是 Host 主机应用，如 IDE；中间层是 MCP Client，它起到了承上启下的桥梁作用，维护 1:1 的连接；最底层是 Server，专注于提供具体的资源、工具和提示词。这种解耦设计让每个 Server 都能轻量化独立运行。

Host Application：发起请求的终端应用（如 Claude Desktop、IDE）。负责用户交互与上下文编排。

MCP Client：协议的核心中枢。维护与 Server 的 1:1 双向连接，处理协议握手与消息路由。

MCP Server：轻量级上下文提供者。通过标准化接口暴露。

MCP 包含三个核心原语。如上图的关系：Resources 是数据，像书本供模型阅读；Tools 是手，赋予模型行动力；Prompts 是说明书，规范模型行为。理解这三者的交互，是构建 MCP 应用的基础。

Resources(资源)：模型可读取的被动上下文数据。如：文件内容、日志、API 返回数据。

Tools(工具)：模型可调用的主动执行能力。如：执行代码、查询数据库、发送请求。

Prompts(提示词)：预置的交互模板与指令脚手架。如：专家角色设定、标准工作流指令。

二、协议通信流程

1、MCP 协议通信的第一步：连接建立。

如以上时序图，这是一个标准的握手流程。客户端首先发送 initialize 请求，携带版本和能力信息；服务端确认后返回其能力配置；最后客户端发送 initialized 通知，标志着连接正式建立，通道就绪。整个过程严格遵循 JSON-RPC 2.0 规范。


# 1. 初始化请求
method: "initialize"
params: { protocolVersion, capabilities, clientInfo }

# 2. 能力协商
result: { protocolVersion, capabilities, serverInfo }

# 3. 就绪通知
method: "notifications/initialized"

2、请求/响应循环

建立连接后，我们进入核心的交互循环。

请看这张流程图：这是标准的“请求-响应”生命周期。重点在于三个环节：一是客户端构造包含 ID 的 JSON-RPC 请求；二是服务端进行路由分发与上下文处理；三是严格基于 ID 进行结果或错误的匹配返回。这个闭环保证了异步通信的有序性。

三、通用案例：文件系统集成

这里展示一个最典型的 MCP 落地场景：文件系统集成。

如图，MCP Server 作为中间层，将本地的文件夹映射为 LLM 可理解的 Resource。

重点在于右侧的三个机制：首先是 URI 映射，让模型能“看到”文件；其次是提供 atomic tools 供模型“操作”文件；最后也是最关键的，就是安全沙箱，必须严格限制访问路径。接下来我们讲讲具体的安全最佳实践。

资源映射机制：将本地目录映射为 MCP Resources，支持通过 URI 协议 (file://) 直接寻址，实现上下文的实时挂载。

原子化工具集：内置 read_file, list_dir, write_file 等原子工具，允许模型自主探索项目结构并修改代码。

安全沙箱边界：严格的路径白名单控制 (Allowed Roots)，禁止越权访问系统敏感目录，确保本地集成安全。

四、安全与权限控制

MCP实现必须遵循的纵深防御体系：

1、接入层（Access Layer）: 传输与身份 (Transport & Identity)

HTTPS/TLS：强制加密传输，实施自动证书轮换

身份认证：仅通过 HTTP Headers 传递 JWT / OAuth2 令牌

2、校验层（Validation Layer）: 流量与校验 (Traffic & Validation)

限流防护：X-RateLimit 反馈 (如 100/min)，限制 Batch Size ≤ 20

3、执行层（Execution Layer）: 运行时防护 (Runtime Safety)

权限控制：方法级白名单 + 细粒度 RBAC 授权

代码安全：严禁，使用静态 Method Mapping 避免注入

五、最佳实践与性能优化

基于 Quicknode 数据的 RPC 性能基准与优化策略。图中数据清楚地展示了优化后的节点（蓝色）在延迟和数据新鲜度上都显著优于普通节点。

数据来源: Quicknode "Comparing RPC Provider Performance"

重点讲解三个策略：首先是必须做多节点负载均衡，避免单点故障；其次是利用 HTTP/2 的连接复用特性；最后是通过批量请求合并来减少网络往返次数。

多节点负载均衡：部署多提供商策略，实施自动失效转移 (Failover)，确保高可用性。

连接层优化：使用 HTTP/2 连接复用减少握手开销，显著降低首字节延迟。

批量与缓存：聚合 RPC 请求 (Batch Size ≤ 20)，对热点查询建立短时缓存。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

从零到商用：MJ+SD+Krita+ComfyUI全流程AIGC设计实战

*真正能投入商用的设计，需要一场“组合拳”——将 MJ 的创意发散、SD 的精细调参、Krita 的手绘修正、ComfyUI 的工作流自动化串联成一条可复用的生产线**。**“MJ + SD + Krita + ComfyUI” 并非四个独立工具的简单叠加，而是构成了一条完整的供应链**：MJ 负责快速验证市场方向，SD 负责量产与定制，Krita 担任品检与修复，ComfyUI 担任包装。- *