AI Agent框架级开发实战课程 - 第一部分 & 第二部分

OpenAI的是一套，Anthropic的是一套，国内的大模型又是另一套。随着多模态、自主智能体（Autonomous Agent）等技术的发展，未来一定会有更高效、更强大的解决方案出现，来解决新的、我们目前还没遇到的需求和挑战。这个中间件负责理解用户的意图，然后替大模型去调用各种第三方工具API，拿到结果后，再整理好交还给大模型，最终生成一段流畅、准确的回答给用户。这样一来，我们的AI应用程序就

朱元禄

552人浏览 · 2025-09-09 08:32:07

朱元禄 · 2025-09-09 08:32:07 发布

AI Agent框架级开发实战课程 - 第一部分 & 第二部分

所有权：朱元禄

第一部分：前言

各位同学，大家好，欢迎来到《AI Agent框架级开发实战》课程。

我们这门课，有一个非常明确的定位：实战。一切内容的设计，都是为了对接企业的实际业务，以项目最终能落地为导向。

那企业是以什么为导向呢？是市场需求。市场需要什么，企业才会去开发什么产品。只有抓住了真实的需求，产品才有市场，我们今天要讨论的“AI化产品”也不例外。它不能是空中楼阁，必须能解决实际的问题，为企业带来真正的价值。

所以，在我们撸起袖子写代码之前，我们必须先搞清楚一个核心问题：AI能力，在企业的IT化建设中，到底能提供什么？ 它扮演的是一个什么样的角色？

(切换PPT)

第二部分：企业AI建设需求的演变

企业的AI需求，并不是一成不变的。它是随着大模型本身能力的边界的扩展而不断演变的。我们可以清晰地划分出几个阶段。

(PPT上出现一个时间轴图示，伴随讲解逐步展开)

timeline
    title 企业AI建设需求演变
    section 阶段一：Function Calling
        初级交互 : 大模型聊天机器人
                  : 通过IT手段扩展能力
                  : 应用与模型紧密耦合
    section 阶段二：厂商封装API
        能力扩展 : 厂商提供内置工具API
                  : 降低提示词工程成本
                  : 产生厂商锁定问题
    section 阶段三：MCP (Model Context Protocol)
        标准化 : 定义工具调用标准协议
                  : 应用与模型解耦
                  : 一套工具对接多模型

第一个阶段：Function Calling 时代

在大模型出现的前一两年，最先爆发的产品是什么？大家肯定都还有印象，就是各种各样的聊天机器人。网页版的、手机APP的，仿佛一夜之间，所有公司都在做“对话式AI”。

这个阶段的核心产品化能力，就是 Function Calling（函数调用）。

大家一定要记住，产品就是用来解决问题的产品。

在那个阶段，大模型本身的能力边界是受限的。它就像一个知识渊博但“四肢瘫痪”的专家，大脑很强，但没有手脚——它无法主动去查看网页、不能读取你的本地文件、也无法访问公司的数据库或远程API。

那怎么办？我们就用IT手段，为它打造“手脚”！这就是Function Calling。我们开发一个AI应用程序，作为用户和大模型之间的中间件。这个中间件负责理解用户的意图，然后替大模型去调用各种第三方工具API，拿到结果后，再整理好交还给大模型，最终生成一段流畅、准确的回答给用户。

(PPT上展示下图及其解释)

+----------------+      +----------------------+      +-----------------+      +---------------+
|                |      |                      |      |                 |      |               |
|    用户输入      | -->  |     AI应用程序        | -->  |     大模型       | -->  |  第三方API     |
|   “帮我订机票”   |      |   (中间件/代理)        |      |   (大脑)         |      | (航空公司官网)  |
|                |      |                      |      |                 |      |               |
+----------------+      +----------------------+      +-----------------+      +---------------+
        ^                                                  |                          |
        |                                                  |                          |
        |                  +----------------------+        |                          |
        +------------------|      整理结果并回复    | <--------+                          |
                           +----------------------+                          |
                                                                              |
                                                                              v
                                                                    +-------------------+
                                                                    |                   |
                                                                    |     返回航班信息    |
                                                                    |                   |
                                                                    +-------------------+

实操情景举例：智能旅行助手

用户输入：“帮我下周六从北京飞上海，选早上的航班，经济舱。”
AI应用程序接收到指令，先调用大模型。
大模型理解后，返回一个结构化指令：{"function": "search_flights", "parameters": {"from": "北京", "to": "上海", "date": "下周六", "time": "早上", "class": "经济舱"}}
AI应用程序根据这个指令，去调用第三方航班搜索API，拿到真实的航班列表。
AI应用程序再次将航班列表交给大模型，说：“这是找到的航班，请用友好、清晰的方式整理给用户，并建议一个最优选。”
大模型生成最终回复：“为您找到了以下航班：1. CA1501, 08:00起飞… 其中CA1501时间最优，建议您选择。”

大家看，在这个流程里，AI应用程序与大模型进行了多次交互，并调用了外部工具。这就是第一阶段最典型的落地模式。

但是，这样做有一个巨大的逻辑问题：开发成本和维护成本极高。

繁琐的提示词工程：每次调用大模型，我们都要传递复杂的system prompt（系统提示词），比如“你是一个旅行助手，你要遵守以下规则：1… 2…”。我们要在提示词里保证逻辑严谨，加入大量的约束说明。
代码成为“屎山”：整个应用的逻辑控制、状态维护、错误处理全都堆砌在这个AI应用程序里。它既要懂业务，又要懂如何和大模型沟通，还要懂如何调用第三方API。逻辑耦合度非常高，版本迭代和功能升级变得异常困难，代码最终会变成难以维护的“屎山”。

第二个阶段：厂商封装API时代

很快，大模型厂商（比如OpenAI）发现了这个问题。他们开始在模型内部封装一些通用的能力，比如代码解释器、文件读取、网页浏览等，然后以标准API的形式提供给开发者。

这样一来，我们的AI应用程序就不用再写那么复杂的提示词去教模型“怎么使用工具”了，直接调用厂商提供的内置工具API就行。这确实降低了提示词工程的成本，简化了开发流程。

但新的问题又出现了：碎片化和厂商锁定（Vendor Lock-in）。

每个大模型厂家提供的这些工具API都不一样！OpenAI的是一套，Anthropic的是一套，国内的大模型又是另一套。如果你想让你开发的AI应用同时支持多个模型，你就得写多套适配代码，这简直是噩梦。

(切换PPT，时间轴指向现在与未来)

第三个阶段：MCP (Model Context Protocol) - 当前的最优解

那么，有没有一种方法，既能享受到Function Calling的灵活性，又能避免“屎山代码”和厂商锁定的问题呢？

有！这就是我们当前阶段最重要的解决方案：MCP（Model Context Protocol，模型上下文协议）。

MCP的核心思想是“标准化”和“解耦”。

标准化：它定义了一套通用的标准协议，规定了“工具”（Tools）应该长什么样、如何被发现、如何被调用、如何返回结果。无论是读取文件、查询数据库还是调用天气预报API，只要它们按照MCP的标准来封装，就是一套统一的接口。
解耦：它将AI应用程序（Agent）、大模型（LLM） 和工具（Tools） 彻底分离开。
- 工具端：只需按照MCP标准实现自己的功能，不用关心是哪个模型或哪个应用来调用它。
- 应用/Agent端：只需学会如何与MCP服务器通信，就能调用所有符合标准的工具，无需再关心工具的具体实现细节。
- 模型端：主要提供推理能力，它只需要理解MCP传来的标准化工具描述即可。

(PPT上展示MCP架构图)

+----------------+     +--------------------+     +------------------+     +---------------+
|                |     |                    |     |                  |     |               |
|    大模型        |     |    AI应用程序       |     |   MCP服务器        |     |   工具们        |
|   (OpenAI,     |     |     (你的Agent)     |     |   (工具管理中心)     |     | (文件, SQL,     |
|   Claude, ...) |     |                    |     |                  |     |   API, ...)   |
|                |     |                    |     |                  |     |               |
+----------------+     +--------------------+     +------------------+     +---------------+
        ^                      ^                           |                          |
        |                      |                           |                          |
        |       标准化对话       |       标准化工具调用协议      |                          |
        +----------------------+                           +--------------------------+

这样一来，带来的好处是颠覆性的：

一套工具，多模型通用：你今天用OpenAI写的工具，明天可以无缝切换给Claude使用。
生态繁荣：你可以像搭乐高一样，组合使用来自全球开发者提供的MCP工具，快速为你的Agent赋能。
专注核心逻辑：你的AI应用程序不再需要处理乱七八糟的工具调用细节，可以更专注于业务逻辑和决策本身。
彻底解决“屎山”：架构清晰，维护和扩展性极大提升。

但是，同学们，MCP也只是一个过程，而非终点。

技术的演进永远不会停止。随着多模态、自主智能体（Autonomous Agent）等技术的发展，未来一定会有更高效、更强大的解决方案出现，来解决新的、我们目前还没遇到的需求和挑战。

而正因为如此，理解MCP背后的“解耦”和“标准化”思想，比学会使用MCP本身更加重要。这是架构设计的核心，能让你无论面对什么新技术，都能快速理解并将其融入你的系统。

课程实践预告

所以，在我们理解了企业AI演进的脉络和当前的最优解之后，从下一节课开始，我将带领大家，使用Python从0开始，亲手搭建一个具备MCP能力的AI Agent平台。

一旦这个平台搭建完成，你就可以像拥有了一把万能钥匙，可以轻松地开发出各种各样的AI产品，无论是智能客服、数据分析助手还是AI编程伴侣，都不在话下。

好了，我们下课休息一下，接下来进入动手环节！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI驱动的价值投资者情绪分析与控制

在金融市场中，价值投资者往往依据公司的内在价值进行投资决策。然而，投资者的情绪会对其决策产生重大影响，可能导致非理性的投资行为，进而影响投资收益。本研究的目的在于探讨如何利用AI技术对价值投资者的情绪进行分析，并在此基础上实现有效的情绪控制。本研究的范围涵盖了金融市场中各类价值投资场景，包括股票、债券、基金等。同时，研究将聚焦于AI在情绪分析和控制中的应用，涉及自然语言处理、机器学习、深度学习等多

2048 AI社区

「Datawhale」RAG技术全栈指南 Task 3

向量嵌入与检索技术概述向量嵌入(embedding)是将高维数据转换为低维稠密向量的技术，其核心在于使语义相似对象在向量空间中距离更近。衡量embedding质量的标准是相近词向量相似度是否更高。相似度度量方法选择：余弦相似度：适合文本检索、聚类/去重等场景点积：L2归一化后等同于余弦相似度欧式距离：适用于图像特征、度量学习等场景向量检索技术： HNSW：多层近邻图结构，适合高召回+低

2048 AI社区

VeADK Agent 一键容器化部署，万字长文带你实战演练

背景近年来，人工智能技术的发展正从模型为中心转向以应用为中心，智能体（Agent）作为 AI 应用的核心载体，其落地部署需求日益迫切。而随着 AI 应用向生产环境迁移，以 Kubernetes 为核心的云原生基础设施成为很多企业的默认选择，为 Agent 应用提供标准化、可扩展且具备成本效益的运行时环境势在必行。根据 CNCF 最新发布的年度云原生调查：Kubernetes 已从容器编排工具，发展