MCP (Model Context Protocol) 简述

MCP的架构设计简洁而强大，它遵循客户端-服务器模型，并清晰地定义了参与者和层级，以确保LLM能够安全、高效地访问外部信息和执行操作。Model Context Protocol（MCP）是连接大型语言模型与外部世界的一项重要技术。它通过标准化的协议和清晰的架构，使得LLM能够安全、高效地访问外部数据和工具，从而极大地扩展了LLM的应用边界。随着AI技术的不断发展，MCP有望成为构建下一代智能应用

ManHanBoy

1011人浏览 · 2025-08-28 11:56:32

ManHanBoy · 2025-08-28 11:56:32 发布

1. 引言

在人工智能飞速发展的今天，大型语言模型（LLM）已经成为众多应用的核心。然而，LLM在实际应用中常常面临一个挑战：如何安全、高效地获取外部数据和工具，从而更好地理解上下文并执行复杂任务？Model Context Protocol（MCP）正是为解决这一问题而生。它旨在为LLM提供一个标准化的“接口”，使其能够像连接USB-C设备一样，轻松地与各种数据源和外部工具进行交互。

本说明书将详细介绍MCP的核心概念、架构、工作原理以及如何利用它来构建更强大、更智能的AI应用。

2. MCP核心概念

MCP是一个开放协议，它规范了应用程序如何向大型语言模型（LLM）提供上下文。可以把MCP想象成AI应用程序的USB-C端口。就像USB-C提供了一种标准化的方式来连接设备到各种外设和配件一样，MCP提供了一种标准化的方式来连接AI模型到不同的数据源和工具。MCP使您能够在LLM之上构建代理和复杂的工作流，并将您的模型与世界连接起来。

MCP提供以下核心能力：

•不断增长的预构建集成列表：您的LLM可以直接插入使用这些集成，无需从头开发。

•标准化的方式：为AI应用程序构建自定义集成，确保互操作性和可维护性。

•一个开放协议：每个人都可以自由实现和使用，促进了生态系统的发展和创新。

•灵活性：允许在不同的应用程序之间切换并随身携带您的上下文，提高了LLM应用的便携性和适应性。

3. MCP架构概述

MCP的架构设计简洁而强大，它遵循客户端-服务器模型，并清晰地定义了参与者和层级，以确保LLM能够安全、高效地访问外部信息和执行操作。

3.1 参与者

MCP架构中的主要参与者包括MCP主机、MCP客户端和MCP服务器。它们协同工作，共同构建起LLM与外部世界交互的桥梁。

•MCP 主机（MCP Host）：这是AI应用程序本身，它负责协调和管理一个或多个MCP客户端。例如，一个基于LLM的代码助手（如Claude Code）或桌面AI应用（如Claude Desktop）都可以作为MCP主机。主机通过MCP客户端与外部MCP服务器建立连接，并利用从服务器获取的上下文来增强LLM的能力。

•MCP 客户端（MCP Client）：MCP客户端是MCP主机内部的一个组件，它维护与特定MCP服务器的连接，并负责从该服务器获取上下文信息供MCP主机使用。每个MCP客户端与一个MCP服务器之间建立专用的点对点连接，确保了通信的隔离性和效率。例如，当Visual Studio Code作为MCP主机连接到Sentry MCP服务器时，Visual Studio Code运行时会实例化一个MCP客户端对象来维护与Sentry服务器的连接。

•MCP 服务器（MCP Server）：MCP服务器是一个程序，它向MCP客户端提供上下文信息。这些服务器可以运行在本地机器上，也可以是远程服务。例如，一个文件系统服务器可以运行在本地，为LLM提供对本地文件内容的访问；而一个Sentry MCP服务器则可能运行在Sentry平台上，提供错误监控和性能数据。MCP服务器是LLM获取外部数据和执行外部操作的关键入口。

3.2 层级

MCP协议由两个主要层级组成，它们共同定义了通信的结构和机制：

•数据层（Data Layer）：这是MCP的核心，它定义了基于JSON-RPC的客户端-服务器通信协议。数据层规定了消息的结构和语义，包括生命周期管理（连接初始化、能力协商、连接终止）以及核心原语（工具、资源、提示和通知）。它关注的是“什么”信息被交换以及“如何”进行逻辑交互。

•传输层（Transport Layer）：传输层负责管理客户端和服务器之间的通信通道和认证。它处理连接的建立、消息的帧化以及安全通信。MCP支持两种主要的传输机制：

•Stdio 传输：使用标准输入/输出流进行直接进程间通信，适用于同一机器上的本地进程，提供最佳性能且无网络开销。

•Streamable HTTP 传输：使用HTTP POST进行客户端到服务器的消息传输，并可选地支持Server-Sent Events（SSE）用于流式传输。这种传输方式支持远程服务器通信，并支持标准的HTTP认证方法（如Bearer Token、API Key）。MCP推荐使用OAuth来获取认证令牌。传输层将通信细节从协议层抽象出来，使得相同的数据层协议可以在不同的传输机制上运行。

4. MCP数据层协议与原语

MCP数据层协议的核心在于其定义了一套丰富的原语，这些原语是客户端和服务器之间进行上下文交换和能力提供的基础。理解这些原语对于有效利用MCP至关重要。

MCP使用JSON-RPC 2.0作为其底层RPC协议。客户端和服务器之间通过发送请求和接收响应进行通信。当不需要响应时，可以使用通知机制。

4.1 生命周期管理

MCP是一个有状态协议，需要进行生命周期管理。生命周期管理的目的是协商客户端和服务器都支持的能力。这确保了双方在通信开始前就明确了彼此的功能，从而实现平稳高效的交互。

4.2 核心原语

MCP原语是MCP中最核心的概念，它们定义了客户端和服务器可以相互提供哪些功能。这些原语指定了可以与AI应用程序共享的上下文信息类型以及可以执行的操作范围。MCP定义了服务器可以公开的三个核心原语：

•工具（Tools）：工具是可执行的函数，AI应用程序可以调用它们来执行特定的操作。这些操作可以是文件操作（如读取、写入文件）、API调用（如查询外部服务）、数据库查询（如获取数据）等。工具使得LLM能够超越纯文本生成，真正地与外部系统进行交互并执行实际任务。例如，一个MCP服务器可以提供一个read_file工具，允许LLM读取指定路径的文件内容。

•资源（Resources）：资源是数据源，它们向AI应用程序提供上下文信息。这些信息可以是文件内容、数据库记录、API响应、系统状态等。资源使得LLM能够获取其完成任务所需的背景知识和实时数据。例如，一个MCP服务器可以提供一个database_schema资源，其中包含数据库的结构信息，LLM可以利用这些信息来构建正确的数据库查询。

•提示（Prompts）：提示是可重用的模板，它们有助于构建与语言模型的交互。这些模板可以包括系统提示（定义LLM的行为和角色）、少样本示例（提供少量输入-输出对以指导LLM的生成）等。提示原语使得开发者能够标准化和优化LLM的输入，从而提高其性能和一致性。例如，一个MCP服务器可以提供一个code_generation_prompt，其中包含用于生成特定编程语言代码的指令和示例。

每个原语类型都有一套关联的方法，用于发现（*/list）、检索（*/get）以及在某些情况下执行（tools/call）。MCP客户端会使用*/list方法来发现可用的原语。例如，客户端可以首先列出所有可用的工具（tools/list），然后选择并执行它们。这种设计允许列表是动态的，即服务器可以根据当前状态或权限动态地提供不同的工具、资源或提示。

例如，考虑一个提供数据库上下文的MCP服务器。它可以公开用于查询数据库的工具、包含数据库模式的资源，以及包含与工具交互的少样本示例的提示。这种组合使得LLM能够智能地理解数据库并执行相关的操作。

除了服务器可以公开的原语外，MCP还定义了客户端可以公开的原语。这些原语允许MCP服务器的作者构建更丰富的交互，例如：

•采样（Sampling）：允许服务器请求语言模型完成。

•用户输入（User Input）：允许服务器请求用户输入。

•日志（Logging）：允许服务器向客户端发送日志消息。

5. MCP SDKs

MCP提供了多种语言的官方SDK（软件开发工具包），旨在简化MCP服务器和客户端的开发过程。这些SDK抽象了底层的协议细节，让开发者能够专注于业务逻辑的实现。所有官方SDK都提供相同核心功能和完整的协议支持，确保了跨语言的互操作性。

目前，MCP支持以下编程语言的SDK：

•TypeScript：适用于JavaScript生态系统中的前端和后端开发。

•Python：广泛应用于AI和数据科学领域，是构建LLM应用的理想选择。

•Go：以其高性能和并发特性，适用于构建高效的MCP服务器。

•Kotlin：在Android开发和后端服务中越来越受欢迎。

•Swift：主要用于Apple平台的应用开发。

•Java：企业级应用开发的主流语言。

•C#：微软生态系统中的主要语言，适用于.NET平台。

•Ruby：以其开发效率和简洁性而闻名。

•Rust：以其内存安全和高性能特性，适用于系统级编程和高并发服务。

通过使用这些SDK，开发者可以大大降低MCP集成的复杂性，加速AI应用的开发和部署。

6. MCP使用示例（概念性）

为了更好地理解MCP的工作原理，我们来看一个概念性的使用示例。假设我们正在构建一个AI代码助手，它需要能够访问本地文件系统并执行一些基本的文件操作。

场景： AI代码助手需要读取用户指定的文件内容。

MCP实现思路：

1.MCP服务器：我们需要一个MCP服务器，它能够访问本地文件系统并提供一个“读取文件”的工具。这个服务器会监听来自MCP客户端的请求。

•工具定义：服务器会定义一个名为read_file的工具，该工具接受一个文件路径作为参数，并返回文件内容。它可能还会定义一个list_files工具，用于列出指定目录下的文件。

•资源定义：服务器可以提供一个file_system_info资源，其中包含文件系统的基本信息，例如根目录路径或可用磁盘空间。

2.MCP主机（AI代码助手）：AI代码助手作为MCP主机，会实例化一个MCP客户端来连接到文件系统MCP服务器。

3.交互流程：

•发现工具：当用户向AI代码助手提出“请帮我读取main.py文件的内容”的请求时，AI代码助手（MCP主机）会通过其MCP客户端向文件系统MCP服务器发送一个tools/list请求，以发现可用的工具。

•选择工具：MCP服务器响应，列出read_file和list_files等工具。AI代码助手根据用户请求，识别出需要使用read_file工具。

•调用工具：AI代码助手通过MCP客户端向文件系统MCP服务器发送一个tools/call请求，调用read_file工具，并传入main.py作为文件路径参数。

•获取结果：MCP服务器执行read_file工具，读取main.py文件的内容，并将结果通过MCP客户端返回给AI代码助手。

•LLM处理：AI代码助手将获取到的文件内容作为上下文提供给其内部的LLM。LLM可以进一步分析文件内容，例如总结代码功能、查找错误或生成注释。

通过这个示例，我们可以看到MCP如何作为一个中间层，使得LLM能够安全、结构化地与外部环境进行交互，从而极大地扩展了LLM的能力边界。

7. MCP的优势与应用场景

MCP的出现为LLM的应用带来了显著的优势，并开辟了广阔的应用场景。

7.1 优势

•标准化与互操作性：MCP提供了一个开放且标准化的协议，使得不同的AI应用和外部服务能够无缝地进行通信。这促进了生态系统的发展，降低了集成成本，并提高了组件的复用性。

•安全性与控制：通过明确定义工具、资源和权限，MCP允许开发者精细地控制LLM可以访问的数据和执行的操作。这对于处理敏感信息和确保AI行为的合规性至关重要。

•可扩展性：MCP的模块化设计使得开发者可以轻松地添加新的MCP服务器来扩展LLM的能力，而无需修改核心AI应用。这使得LLM能够适应不断变化的需求和新的数据源。

•上下文感知：MCP使得LLM能够获取丰富的外部上下文信息，从而提高其理解能力和生成内容的准确性。LLM不再局限于其训练数据，而是能够实时地获取和利用外部世界的最新信息。

•代理能力增强：通过工具原语，MCP赋予了LLM执行实际操作的能力，使其能够充当更强大的“代理”。LLM可以不仅仅是回答问题，还可以执行任务、自动化工作流。

•简化开发：官方SDKs的存在大大简化了MCP的集成和开发过程，让开发者能够专注于构建创新性的AI功能，而不是处理复杂的协议细节。

7.2 应用场景

MCP的应用场景非常广泛，几乎涵盖了所有需要LLM与外部系统交互的领域：

•智能代码助手：LLM可以访问代码库、文件系统、版本控制系统，帮助开发者进行代码生成、调试、重构和文档编写。

•企业知识管理：LLM可以连接到企业内部的数据库、文档管理系统、CRM系统，为员工提供快速、准确的信息检索和分析。

•自动化工作流：LLM可以与各种SaaS工具（如日历、邮件、项目管理工具）集成，自动化日常任务，如安排会议、发送邮件、更新任务状态。

•数据分析与报告：LLM可以访问数据仓库、BI工具，执行数据查询、生成报告、发现数据洞察。

•智能客服与支持：LLM可以连接到客户数据库、产品知识库，提供个性化的客户服务和技术支持。

•物联网（IoT）集成：LLM可以与IoT设备的数据流连接，监控设备状态、分析传感器数据、执行远程控制命令。

•个性化推荐系统：LLM可以访问用户行为数据、商品信息，生成高度个性化的推荐。

8. 总结

Model Context Protocol（MCP）是连接大型语言模型与外部世界的一项重要技术。它通过标准化的协议和清晰的架构，使得LLM能够安全、高效地访问外部数据和工具，从而极大地扩展了LLM的应用边界。随着AI技术的不断发展，MCP有望成为构建下一代智能应用的关键基础设施。希望本新手向说明书能帮助您更好地理解MCP，并激发您利用它来创造更多创新性AI应用的灵感。

参考文献：

[1] Model Context Protocol 官方网站. Introduction - Model Context Protocol [2] Anthropic. Introducing the Model Context Protocol. Introducing the Model Context Protocol \ Anthropic [3] Wikipedia. Model Context Protocol. https://en.wikipedia.org/wiki/Model_Context_Protocol [4] IBM. What is Model Context Protocol (MCP)?. What is Model Context Protocol (MCP)? | IBM [5] Cloudflare. What is Model Context Protocol (MCP)?. https://www.cloudflare.com/learning/ai/what-is-model-context-protocol-mcp/ [6] Google Cloud. What is Model Context Protocol (MCP)? A guide. https://cloud.google.com/discover/what-is-model-context-protocol [7] Descope. What Is the Model Context Protocol (MCP) and How It Works. What Is the Model Context Protocol (MCP) and How It Works [8] Vercel. Model Context Protocol (MCP) explained: An FAQ. Model Context Protocol (MCP) explained: An FAQ - Vercel [9] Microsoft DevBlogs. Model Context Protocol (MCP) is Now Generally Available in Visual Studio. https://devblogs.microsoft.com/visualstudio/mcp-is-now-generally-available-in-visualstudio/ [10] Coursera. Model Context Protocol (MCP) Mastery. Model Context Protocol (MCP) Mastery | Coursera

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

悟空 AI CRM 客户功能：深度洞察与精细化管理，赋能企业增长

在当今激烈的市场竞争环境中，客户资源作为企业的核心资产，其管理和运营的质量直接关系到企业的生存与可持续发展。一个高效且智能的客户关系管理系统（CRM）成为了企业不可或缺的工具，而悟空 AI CRM 正是这样一款集前沿科技与人性化设计于一身的 CRM 解决方案。它通过深度洞察客户需求、精细化管理客户关系，为企业提供了全方位的客户管理支持，助力企业在竞争中脱颖而出。

2048 AI社区

AI时代的人类认知进化与能力重塑：未来生存指南

AI不是人类的对手，而是认知加速器。未来社会的核心竞争力，不再是职位或技能，而是认知能力、创造力、系统思维和价值判断。工具改变效率，思维决定未来；信息触手可及，深度认知才有价值；AI可以执行，人类定义意义。未来属于能够驾驭智能、重塑认知、持续创造的人思考、创新、价值创造，是人类在AI时代永恒不变的核心资产。

2048 AI社区

UVa 1724 Solitaire

本文研究8×8棋盘上4个相同棋子的移动问题，允许普通移动和跳跃移动。给定初始和目标配置，判断能否在最多8步内转换。采用双向BFS算法优化搜索，将状态编码为排序的位置集合，通过生成所有可能移动来扩展搜索。算法利用哈希集合存储已访问状态，当两个搜索方向相遇时判定可达。复杂度分析表明双向BFS将状态空间从O(b^d)降至O(b^(d/2))，在合理时间内解决问题。关键技术包括状态编码、移动生成规则和双向