在这里插入图片描述

每天打开手机,各种 AI 相关的名词就像潮水一样涌来 —— agent、MCP、function calling… 这些词看起来高深莫测,仿佛在说某种加密语言。作为一个曾经对着这些术语犯迷糊的人,今天我想用最接地气的方式,带你把这些AI世界的"黑话"彻底搞明白。

从简单的聊天开始:Prompt 的前世今生

2023年OpenAI发布GPT时,AI还只是个简单的聊天框。我们发消息给它,它回复我们——这些消息有个专业叫法,叫user prompt(用户提示词),说白了就是我们的问题或想说的话。

但很快有人发现不对劲:同样问"肚子疼",我妈会让我去医院,我爸会催我上厕所,女朋友可能直接怼回来"滚远点,老娘也疼"——可AI只会给个四平八稳的标准答案,无趣得很。

问题出在哪?AI 没有"人设"。于是有人想到:把人设塞进提示词里试试?比如发一句"你扮演我女朋友,我肚子疼",AI果然就会怼人了。但这样总觉得有点怪,毕竟"扮演女朋友"不是我们真正想说的内容。

聪明的开发者们干脆把人设信息单独拎出来,做成了system prompt(系统提示词)。它就像给AI写的"剧本",规定了AI的角色、性格、说话语气——所有不是用户直接说的内容,都能塞进去。每次我们发 user prompt 时,系统会自动把这两份提示词一起发给AI,对话瞬间就自然多了。

现在很多聊天机器人里,system prompt 都是预设好的,但像 ChatGPT 会提供 “customize ChatGPT” 功能,让我们写的偏好自动变成 system prompt 的一部分,相当于给AI定制"个性"。

让 AI 自己动手:Agent 和 Tool 的诞生

光会聊天还不够,能不能让AI真的帮我们做事?第一个吃螃蟹的是开源项目 AutoGPT。它像个小助手,能帮你管理电脑文件——但前提是你得先给它准备好工具:比如listFiles(列目录)、readFiles(读文件)这些函数。

把这些工具注册给 AutoGPT 后,它会生成一个特殊的 system prompt ,告诉AI:“你有这些工具,用法是这样,想用的话得按这格式说”。当你让它找"原神安装目录"时,AI 会按格式要求调用工具,AutoGPT 解析后执行操作,再把结果返回给 AI,直到任务完成。

这种在模型、工具和用户之间当"传话筒"的程序,就叫AI agent;那些可供调用的函数或服务,就是agent tool。不过AI毕竟是概率模型,偶尔会"不听话"——返回的格式不对。所以很多agent会自动重试,一次不行就来第二次,像个执着的小助理。

更规范的协作:Function Calling 的进化

反复重试总归有点不靠谱。于是 ChatGPT、Jina AI 这些大模型厂商推出了 function calling(函数调用)功能,核心就俩字:规范。

以前用 system prompt 描述工具时,怎么写全凭感觉,只要 AI 看得懂就行。现在 function calling 要求所有工具都用 JSON 对象定义:name 字段写工具名,description 写功能,parameters 列参数——就像给每个工具发了张"身份证"。

更妙的是,这些 JSON 对象从 system prompt 里独立出来,有了自己的专属位置;AI调用工具的回复格式也被统一规定。这样一来,开发者能更有针对性地训练AI,就算AI犯错,服务器也能自动检测并重试,用户完全感觉不到。

不过这功能也有小遗憾:没有统一标准。各家大厂的 API 定义五花八门,不少开源模型还不支持,想做个跨模型通用的 agent,还是有点头疼。

AI世界的"USB协议":MCP 是什么?

聊完 agent 和模型的沟通,再看看 agent 和工具怎么协作。最早大家把 agent 和 tool 写在同一个程序里,直接调用就行。但后来发现,很多工具是通用的——比如网页浏览工具,好几个 agent 都要用,总不能每个里面都抄一遍代码吧?

这就像每个设备都得装专属驱动,太麻烦了。于是MCP协议诞生了(Modle Context Protocal),你可以把它理解成 AI 世界的 “USB协议” ——专门规范 agent 和 tool 服务之间的通信。

运行工具的服务叫 MCP Server,调用工具的 agent 叫 MCP Client。MCP 规定了它们怎么通信,Server 要提供哪些接口(比如查询有哪些工具、参数格式是什么)。除了普通的 tool(函数调用形式),MCT Server 还能直接提供数据、文件读写服务 或为 agent提供提示词模板。

有意思的是,MCP 虽然是为 AI 定制的,但它本身和 AI 模型一点关系都没有——不管 agent 用的是 GPT 还是别的模型,MCP 只管帮它管好工具、资源和提示词。

串起来看:AI 协作的完整链条

说了这么多,这些概念到底怎么一起工作?举个例子你就明白了:

当我问 AI agent "女朋友肚子疼该怎么办"时,整个流程是这样的:

  1. 我的问题变成 user prompt 传给 agent
  2. agent 通过 MCP 协议从 MCP Server 拿到所有 tool 的信息
  3. 这些信息被转换成 system prompt 或 function calling 格式,和 user prompt 一起发给AI模型
  4. AI 模型发现有个 Web Browser(网页浏览工具),于是通过 function calling 格式生成调用请求
  5. agent 通过 MCP 协议调用 MCP Server 的 Web Browser 工具
  6. 工具访问指定网站后,将内容返还给 agent,再转发给 AI 模型
  7. AI 模型结合网页内容"头脑风暴",得出"多喝热水"的结论
  8. 最后由 agent 把结果展示给我

这些概念就像一个个齿轮,环环相扣构成了 AI 自动化协作的完整体系。它们不是谁取代谁,而是各司其职,一起让 AI 变得更聪明、更能干。

写在最后

现在再看那些 AI 术语,是不是清晰多了?其实技术名词背后,都是让 AI 更好服务人类的努力。有人说AI的进步让人焦虑,但我更多感受到的是激动——毕竟能亲眼见证并参与这样的技术变革,本身就是件幸运的事。

如果说时代的洪流注定要呼啸而过,那不如清醒地迎上去,从搞懂这些"黑话"开始。毕竟,理解技术,才能更好地驾驭未来。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐