agent领域的常见名词梳理(llm/functioncalling/mcp/skill)

本文梳理了AI智能体(Agent)相关的核心概念与演进过程。从语言模型到LLM的转变开始，分析了Agent如何通过记忆(Memory)实现多轮对话，以及通过Function Calling和MCP协议与LLM、工具服务交互。文章对比了LangChain、WorkFlow和Skill的区别，指出Skill可能成为前两者的替代方案。最后总结了Agent的本质是处理不需要智能的固定程序部分，而将模糊逻辑

翻滚的小@强

401人浏览 · 2026-03-06 16:44:39

翻滚的小@强 · 2026-03-06 16:44:39 发布

1. 写在前面

最近agent 爆火，与之相关的名词也层出不穷，作为一个AI小白，怎么能快速的入门学习一些agent的知识以及使用好agent呢？我觉得应该先从名词开始。
在这里插入图片描述

这篇文章用一个框架，把常用的基本名词给梳理一下，主要参考的这个视频，把我学习过程中的笔记整理，分享给大家。更详细的内容可以参考上面视频链接。

一张图总结：
在这里插入图片描述

ok, let’s go!

2. 演进

语言模型的发展，在chatgpt时刻出现拐点，涌现出智能。
在这个时间点，为了和之前语言模型有区分，加了⼀个L，到了LLM时代。

LLM 本⾝只能文字接龙，看起来是个智障
人为分开角色(user, agent)，划分成一问一答，就实现了对话。

在这里插入图片描述
注意：只能一问一答，不能追问。

如果想追问怎么办？

把每次的对话历史放到context部分，作为上下文
伪装成多轮对话，这些特殊的上下文起了个名字叫 memory

记忆还可以进⼀步调用大模型总结，对记忆做压缩

大模型现在没有上网查资料能力？写⼀段能上网的程序。
于是继续演进成下面这样：
在这里插入图片描述

3. 聚焦交互

3.1 Agent <-> LLM

3.1.1 FunctionCalling

如果用自然语言沟通，不太可控大模型的操作，所以需要约定⼀些规范。

在这里插入图片描述
大模型与agent对话之间的约定格式，叫 function calling
具体agent 和 LLM 对话的时候，应该是会把目前能用的⼯具以及说明给到大模型，让大模型自己选。

3.1.2 MCP

mcp全称是model context protocol，意思是模型上下文协议。
智能体能用的各种工具，单独抽出来，在agent 与⼯具之间，定义⼀套调用规范)
在这里插入图片描述
agent是⼀个传话筒，在大模型与工具调用之间进行传话。

3.1.3 MCP VS FunctionCalling

Functioncalling:

Agent 与大模型之间沟通的约定
目的是让大模型的回答符合⼀定的格式，方便程序解析
Mcap:
• Agent 与⼯具服务之间调用的约定
• 目的是像接口文档⼀样，约定怎么调用，怎么传参，怎么接收返回值

3.2 Agent <-> User

3.2.1 交互形式诞生各种产品

在这里插入图片描述

3.2.2 LangChain or WorkFlow or Skill

假设有这样的⼀个稳定的任务：
在这里插入图片描述
没有必要每次都让智能体进⾏规划，非常麻烦也非常浪费token。
所以可以把稳定的流程固化下来，提取和保存设置成脚本，翻译部分和大模型对话。

编程角度编写链式任务： Langchain
用户角度实现链式任务： workflow(dify)

再看输入和输出部分，如果输入不止⼀种格式，输出也不止⼀种格式。
且不牺牲 用户自然语言 触发的体验（if else 写程序会打破这种体验）。

设计思路：

在这里插入图片描述
给agent下达指令之前，增加

优化空间：提前约定好某个指定位置，agent中写死⼀段程序，读取这个目录下面的所有skill.md，
把 skill_name, skill_description 信息拿出来。把这些给到大模型让它自己选用哪个skill。
在这里插入图片描述
于是乎现在就变成了：