AI 技术体系核心概念

本文基于技术原理复杂度应用落地门槛认知理解层级三大维度,对 6 个核心 AI 概念进行 “先易后难” 排序,拆解每级概念的核心逻辑与复杂度来源,助力逐步掌握 AI 技术演化脉络。

1. WorkFlow(工作流):AI 任务的 “流水线说明书”

难度:★☆☆☆☆

核心定义

将复杂任务拆解为有序步骤,按预设流程执行以确保准确性和效率,类似工厂流水线的 “生产手册”—— 仅关注 “步骤先后”,不涉及 AI 模型底层逻辑。

理解类比

做蛋糕的标准化步骤清单:备料→搅拌→烘焙→装饰,每一步必须依赖上一步结果(如无搅拌好的面糊则无法烘焙),避免操作遗漏或顺序错乱。

复杂度来源

仅需掌握 “任务拆解” 和 “顺序依赖” 的基础逻辑,无需理解 AI 模型原理,本质是 “流程管理工具”,上手门槛极低。

典型场景

  • 企业订单处理:检查库存→创建补货任务→通知客户

  • 财务发票审核:发票验真→匹配合同→财务入账

2. RAG(检索增强生成):AI 的 “实时查资料小助手”

难度:★★☆☆☆

核心定义

通过检索外部知识库(企业文档、数据库等)增强大语言模型(LLM)的回答准确性,解决 LLM “知识过时”(如未收录 2024 年新政策)和 “幻觉”(虚构信息)问题。

理解类比

学生写论文的过程:先通过知网检索相关文献(对应 “检索” 环节),再结合文献内容组织论文答案(对应 “生成” 环节),而非仅凭记忆虚构内容。

核心流程拆解

  1. 文档预处理:将企业手册、行业报告等拆分为 500 字左右的片段,转换为计算机可识别的 “向量嵌入”;

  2. 向量存储:将向量嵌入存入向量数据库(如 Milvus、Pinecone),建立 “知识索引”(类似图书馆的书籍分类目录);

  3. 查询匹配:用户提问时,从向量数据库中检索与问题最相关的 3-5 个文档片段;

  4. 生成回答:LLM 基于检索到的真实内容生成回答,避免虚构信息。

复杂度来源

需理解 “向量嵌入”(将文字转为数字向量)和 “相似性匹配” 的基本逻辑,但无需接触模型训练细节,现有工具(如 LangChain)已封装核心流程,应用门槛较低。

典型场景

  • 企业知识库问答:员工查询 “报销流程” 时,实时检索内部报销手册并生成步骤回答;

  • 智能客服:用户咨询 “产品保修政策” 时,检索最新售后文档并准确回复。

3. 微调(Fine-tuning):大模型的 “岗前特训”

难度:★★★☆☆

核心定义

用私有数据(如企业内部问答、行业专属术语)调整预训练大模型的参数,让 AI 从 “通用学霸”(如 GPT-4、文心一言)转变为 “领域专家”(如法律 AI、医疗 AI)。

理解类比

预训练大模型像 “大学毕业生”(掌握通用知识),微调则是企业的 “岗前培训”—— 通过 100 个公司专属案例(如 “客户分级标准”“项目审批流程”),让模型快速掌握企业特有的知识和规则。

关键价值

  • 补充私有知识:如企业内部管理流程、未公开的业务数据;

  • 更新时效信息:如 2024 年后的新政策、行业新规范;

  • 降低训练成本:无需从零训练模型(预训练模型已具备基础能力),仅需少量数据调整参数。

复杂度来源

需理解 “模型参数调整”“过拟合风险”(模型过度依赖训练数据,泛化能力下降)等基础概念,涉及数据清洗(剔除无效数据)和训练流程(如学习率设置),但现有框架(如 PEFT、LoRA)已简化操作,逻辑清晰易懂。

典型场景

  • 法律 AI:用 1000 个合同审查案例微调通用模型,使其能准确识别合同中的 “风险条款”;

  • 医疗 AI:用 500 个病历数据微调模型,使其能根据症状初步判断常见疾病。

4. AGENT(智能体):AI 界的 “数字员工”

难度:★★★★☆

核心定义

具备自主意识的软件实体,能感知环境、推理决策并执行复杂任务,核心组成包括 Prompt 指令、流程控制、上下文累积等 —— 区别于 “按固定步骤执行” 的 WorkFlow,AGENT 可 “主动应对变化”。

理解类比

传统程序是 “按剧本演戏”(固定步骤,如 WorkFlow),AGENT 则是 “餐厅服务员”:

  • 感知:观察顾客是否举手示意;

  • 决策:根据顾客需求推荐菜品(如推荐素食给素食顾客);

  • 应变:若推荐菜品售罄,主动换推同类菜品。

核心能力

  • 环境感知:读取报表数据、监控系统指标(如服务器负载)、识别用户输入意图;

  • 决策规划:发现 “销售额骤降” 异常时,制定 “关闭异常促销开关→通知运营团队” 的解决方案;

  • 工具调用:通过 MCP 协议调用外部工具(如浏览器查实时数据、钉钉发通知、Excel 生成报表)。

复杂度来源

需整合 “流程控制”“工具调用”“上下文管理”(记住任务中间结果)等多模块,理解 “自主性”(无需人工干预)与 “目标驱动”(围绕核心目标调整动作)的逻辑,是 “单一技术” 到 “综合系统” 的跨越。

典型场景

  • 报表异常检测:自动读取每日销售报表,识别异常数据后,调用钉钉通知运营团队并生成分析报告;

  • 自动建任务:根据项目进度表,发现 “设计任务延期” 时,自动在项目管理工具(如 Jira)中创建跟进任务。

5. MCP(模型上下文协议):AI 工具的 “万能转换器”

难度:★★★★☆

核心定义

解决 LLM 与外部工具集成的 “标准化协议”,类似 “万能插座”—— 让不同模型(GPT、Claude、文心一言)和不同工具(Excel、数据库、浏览器)无需定制接口即可无障碍通信。

理解类比

过去大模型调用工具需 “每个工具配一个转接头”(如调用 Excel 需开发 Excel 专属接口,调用数据库需开发数据库专属接口),MCP 则统一为 “USB-C 接口”:所有模型和工具只需适配 MCP 标准,即可互相调用。

核心组件

  • MCP 主机:访问入口(如 Claude Desktop、企业 AI 平台),负责接收模型请求和工具响应;

  • MCP 客户端:处理通信细节(如数据格式转换、传输加密),确保模型与工具之间数据传输顺畅;

  • MCP 服务器:暴露工具功能(如 “读取 Excel 单元格数据”“查询数据库表”),让模型可直接调用。

复杂度来源

需理解 “客户端 - 服务器架构”“协议标准化”(定义统一的数据格式和交互规则)“多模型适配” 等底层技术,偏向 “技术架构” 层面,涉及通信协议设计和工具集成逻辑,需具备基础的软件架构认知。

典型场景

  • 多模型调用 Excel:GPT 和 Claude 无需分别开发 Excel 接口,通过 MCP 即可统一读取 Excel 数据;

  • 跨工具协同:模型先通过 MCP 调用数据库查询客户数据,再调用钉钉将数据发送给销售,无需人工切换工具。

6. Agentic AI:多智能体的 “协作团队”

难度:★★★★★

核心定义

多智能体协同工作的架构,具备动态任务分解与高级编排能力,突破单智能体的能力边界 —— 适用于医疗诊断、科研协作、城市管理等 “单智能体无法完成” 的复杂场景。

理解类比

单 AGENT 是 “个人助理”(可独立完成简单任务,如订机票),Agentic AI 则是 “项目团队”:

以医疗诊断为例,三个 AGENT 协同工作:

  • 影像分析 AGENT:检测 CT 影像中的病灶;

  • 病理分析 AGENT:根据病灶样本判断良恶性;

  • 治疗规划 AGENT:结合前两者结果制定治疗方案;

三者实时共享数据,共同完成 “癌症诊断与治疗规划” 任务。

关键特征

  • 动态任务分解:将 “科研协作” 拆解为 “文献检索→数据处理→论文撰写→查重修改”,自动分配给不同 AGENT(如文献检索 AGENT、数据处理 AGENT);

  • 长上下文共享:团队内所有 AGENT 共享任务进度和中间结果(如数据处理 AGENT 将处理后的实验数据同步给论文撰写 AGENT);

  • 跨框架协作:即使 AGENT 基于不同开发框架(如 LangGraph、CrewAI、AutoGPT),也能通过 A2A(Agent-to-Agent)协议实现通信。

复杂度来源

需理解 “多智能体交互规则”(如任务分配优先级)、“冲突解决机制”(如两个 AGENT 结论矛盾时如何决策)、“分布式架构”(AGENT 部署在不同节点)等系统级问题,是当前 AI 领域的前沿方向,认知门槛和技术实现难度最高。

典型场景

  • 医疗诊断:多 AGENT 协同完成 “影像检测→病理分析→治疗规划”;

  • 科研协作:多 AGENT 分工完成 “文献检索→实验数据处理→论文撰写→查重修改”;

  • 城市管理:多 AGENT 协同监控 “交通流量→空气质量→公共设施状态”,联合应对城市突发情况(如暴雨导致交通拥堵时,调度交通 AGENT 和应急 AGENT)。

总结:从 “工具使用” 到 “系统协同” 的能力跃迁

AI 技术概念的复杂度演进,本质是从 “单一工具操作” 到 “多系统协同” 的能力升级,且每个概念都是下一级的基础(如 Agentic AI 依赖 AGENT 的自主性、MCP 的工具调用能力、WorkFlow 的任务拆解逻辑)。

概念 核心逻辑 认知门槛 典型应用场景
WorkFlow 步骤拆解与顺序执行 流程思维 订单处理、发票审核
RAG 外部知识检索增强回答 检索与生成结合逻辑 企业知识库问答、智能客服
微调 私有数据定制模型参数 模型训练基础 法律 AI、医疗 AI 等行业专属模型
AGENT 单智能体自主感知 - 决策 - 执行 综合系统思维 报表异常检测、自动建任务
MCP 模型与工具的标准化通信 软件架构与协议认知 多模型调用工具、跨工具协同
Agentic AI 多智能体动态协作与任务编排 系统级协同与分布式思维 医疗诊断、科研协作、城市管理
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐