主流AI 七层关系:Token→提示词→上下文→Agent→Harness→MCP→Skills
AI能力堆栈分为三层:基础交互层(Token、提示词、上下文)处理文本交互;智能体与编排层(Agent、Harness、MCP)实现任务拆解和外部连接;业务应用层(Skills)封装具体功能。整个过程如同造车:从零件(Token)到控制系统(Agent+Harness),通过标准协议(MCP)连接外部资源,最终实现"自动泊车"等具体功能(Skills)。

“主流 AI 七层关系”,其实勾勒出了当前大模型应用从最基础的文本处理单元到复杂自动化执行的完整逻辑链路:
-
Token(令牌/词元)
这是 AI 处理文本的最小单位。无论是英文的片段、中文的单字或词语,模型在底层都是先把输入拆分成 Token 进行理解和计算,它是所有交互的“原子级”起点。
-
提示词(Prompt)
由 Token 组成,是用户直接发给模型的指令或问题。它决定了模型“现在要做什么”,比如“写一份周报”或“翻译这段代码”,是触发 AI 能力的直接入口。
-
上下文(Context)
指模型在交互过程中“记住”的信息集合,包括当前的提示词、之前的对话历史、设定的角色规则等。它让 AI 的回复不是孤立的,而是能保持连贯的逻辑和记忆(受限于上下文窗口大小)。
-
Agent(智能体)
当模型不再只是单次回复,而是能根据任务自主规划步骤、决定调用什么工具时,就升级为了 Agent。它利用提示词和上下文理解目标,主动拆解任务,是向自动化迈进的核心层。
-
Harness(编排/控制框架)
这一层可以理解为 Agent 的“运行环境”或“约束框架”。它负责编排 Agent 的执行流程,管理资源、处理安全限制、循环调度(比如让 Agent 反思重试),确保 Agent 稳定、可控地运行,防止跑偏。
-
MCP(Model Context Protocol,模型上下文协议)
这是近期 Anthropic 推动的标准化协议层,相当于 Agent 与外界系统之间的“通用接口”。它统一了 Agent 如何结构化地访问外部数据源或工具(如读取本地文件、连数据库、调 API),解决了以往每个工具都要定制集成的痛点,让 Skills 层的复用更高效。
-
Skills(技能/工具执行)
这是最外层的“动手能力”,即 Agent 通过 MCP 实际调用的具体功能模块(如执行代码、发送邮件、查天气预报、操作浏览器)。Skills 是 AI 意图转化为现实世界动作的最终落地。
这个链条描述的是AI应用从底层技术到上层业务能力的演进关系,可以理解为一条能力堆栈:
Token → 提示词 → 上下文 → Agent → Harness → MCP → Skills
我把它们拆成三层来看,会更清晰:
第一层:基础交互层(数据与对话基础)
-
Token(词元):模型处理的最小语义单元,是计费和计算的基本单位。
-
提示词(Prompt):用户输入的指令,由 Token 组成,用于引导模型生成。
-
上下文(Context):整个对话的历史信息(提示词+多轮回复),构成模型的“记忆”。它受上下文窗口限制,越长,能处理的任务越复杂。
关系:Token 组成提示词,提示词与历史回复共同构成上下文。这一层是纯文本级别的交互。
第二层:智能体与编排层(让模型能自主做事)
-
Agent(智能体):在上下文基础上,增加了思考、规划、调用工具的能力。它不再只是聊天,而是能把复杂任务拆解执行。
-
Harness(约束框架):为 Agent 提供的执行环境和护栏。它定义 Agent 能做什么、不能做什么,管理状态、处理错误。可以理解为 Agent 的“操作系统”。
-
MCP(模型上下文协议):由 Anthropic 提出的开放协议标准。它本质是一种特殊的上下文,是 Agent 和外部工具/数据源之间的标准化连接方式。
关系:Agent 在 Harness 的约束保护下运行,通过 MCP 这种标准协议来获取和扩展上下文、连接外部世界。MCP 解决了“每个工具都要单独开发接口”的碎片化问题,让 Agent 的上下文能动态增强。
第三层:业务应用层(最终交付给用户的能力)
-
Skills(技能):直接面向用户的、可执行的具体功能。比如“整理会议纪要”、“监控竞品价格”、“处理订单”等。
关系:Skill 是前面所有层的封装和具象化产物。一个 Skill 背后,是 Agent 利用 Harness 和 MCP 连接的工具,理解上下文中的用户指令,通过消耗 Token 计算而完成的一个完整业务操作。
整体关系一句话总结
Token 是最小单元,提示词和上下文构成对话基础;Harness 为 Agent 提供执行环境和护栏;Agent 通过 MCP 这种标准协议动态扩展上下文、连接工具;这些组合在一起,最终封装成面向用户的 Skills。
从 Token 开始构建理解 → 通过 Prompt 和 Context 实现交互与记忆 → 用 Agent 自主执行任务 → 以 Harness 做安全控制 → 靠 MCP 连接外部系统 → 最终通过 Skills 输出实际价值。
就像造一辆车:
-
Token 是基本零件
-
提示词/上下文是方向盘和当前驾驶状态
-
Agent 是自动驾驶系统
-
Harness 是整车电控和底盘约束
-
MCP 是车与所有外部设施(充电桩、路测设备)通信的统一标准
-
Skills 是最终实现的“自动泊车”、“高速领航”等功能
更多推荐


所有评论(0)