AI核心概念详解（附图）

喂阿伟

373人浏览 · 2026-03-25 16:50:48

喂阿伟 · 2026-03-25 16:50:48 发布

第一部分：AI与LLM - 从宏观到具体

1. AI：人工智能

一句话解释：让机器模拟人类智能行为的技术。

详细说明：
人工智能（Artificial Intelligence）是一个广泛的领域，目标是让计算机能够像人一样思考、学习、决策。它包括多个子领域：

机器学习：让计算机从数据中自动学习
计算机视觉：让计算机"看懂"图像和视频
自然语言处理：让计算机理解、生成人类语言
机器人技术：让机器能够感知和行动

关键点：AI不是单一技术，而是一个技术集合。

2. LLM：大语言模型

一句话解释：专门处理语言的人工智能模型。

详细说明：
大语言模型（Large Language Model）是AI的一个子领域，专注于理解和生成人类语言。它通过在海量文本数据上训练，学会了语言的规律。

在这里插入图片描述

图1：AI与LLM的关系 - LLM是AI的一个子领域

常见LLM：

GPT系列（OpenAI）：ChatGPT、GPT-4
Claude系列（Anthropic）：Claude 3
开源模型：LLaMA、ChatGLM、Qwen
国内模型：文心一言、通义千问、智谱清言

关键点：LLM让计算机能够理解和生成自然语言，这是当前AI应用最广泛的领域。

第二部分：核心基础 - Token、Context、Prompt

3. Token：文本的基本单元

一句话解释：大模型处理文本时的"文字碎片"。

详细说明：
Token是LLM处理文本的基本单位。你可以把它理解为"文字碎片"或"文本切片"。

英文：1个Token ≈ 0.75个单词
中文：1个Token ≈ 1-2个汉字
示例：“我爱AI” → [“我”, “爱”, “AI”]（3个Token）

为什么重要：

计费基础：大多数API按Token数量收费
长度限制：模型有最大Token限制（如GPT-4的128K）
处理效率：Token数量影响处理速度和成本

4. Context：上下文窗口

一句话解释：模型能够"记住"的文本范围。

详细说明：
Context（上下文）是指模型在一次对话中能够处理和记忆的文本范围。就像人类的短期记忆，有一定的容量限制。

在这里插入图片描述

图2：Token与Context的关系 - Token是处理单位，Context是处理范围

关键信息：

GPT-4：128K Token上下文
Claude 3：200K Token上下文
长上下文允许处理更长文档和对话

实用建议：

重要信息放在对话开头（模型记忆更清晰）
长文档可以分段处理
及时总结关键信息，避免超出上下文限制

5. Prompt：提示词

一句话解释：你给AI的指令和问题。

详细说明：
Prompt（提示词）是你与AI沟通的方式。好的Prompt能够获得更准确、更有用的回答。

Prompt的核心结构：

指令：明确告诉AI要做什么
上下文：提供必要的背景信息
示例：展示你期望的格式
格式：指定输出的结构

图3：Prompt的核心结构和设计原则

Prompt设计黄金法则：

明确具体：不要问"帮我写代码"，要问"用Python写一个计算斐波那契数列的函数"
提供上下文：告诉AI你的身份、目标和限制条件
分步骤：复杂任务分解为多个步骤
指定格式：要求JSON、Markdown等特定格式

高级技巧：

思维链：让AI展示思考过程，提高准确性
角色扮演：指定AI的身份，如"你是一位资深架构师"
少样本学习：提供几个示例，让AI学习模式

第三部分：高级能力 - Agent、Skill、MCP

6. Agent：智能体

一句话解释：能够自主行动、使用工具的AI系统。

详细说明：
AI Agent不仅仅是回答问题，它能够：

规划任务：分解复杂任务，制定执行步骤
使用工具：调用API、运行代码、操作文件
记忆学习：记住对话历史，从经验中学习
自主行动：在无人干预下完成任务

在这里插入图片描述

图4：AI Agent的核心能力 - LLM + 工具 + 记忆 + 规划

Agent的进化路径：

简单工具：问答机器人（如ChatGPT）
任务Agent：执行特定任务（如数据分析）
自主Agent：独立决策行动（如AutoGPT）
协作Agent：多Agent协同工作（如CrewAI）

为什么Agent重要：

自动化：替代重复性人工操作
智能化：结合多种工具和能力
专业化：深度优化特定领域问题

7. Skill：技能

一句话解释：AI能够执行的特定操作。

详细说明：
Skill（技能）是AI能够执行的具体能力，就像人的技能一样。常见的AI技能包括：

搜索技能：查询实时信息
计算技能：进行数学运算
文件操作：读写和处理文件
数据分析：处理Excel、CSV等数据
图表生成：创建数据可视化
API调用：与外部服务交互

8. MCP：模型上下文协议

一句话解释：标准化AI与工具交互的协议。

详细说明：
MCP（Model Context Protocol）是一个开源协议，用于标准化AI模型与工具、数据源之间的交互。

MCP的核心价值：

标准化接口：统一工具调用方式
安全控制：权限管理和访问控制
上下文管理：维护会话状态
工具发现：自动识别可用工具

在这里插入图片描述

图5：MCP与Skill的关系 - MCP协议让AI能够调用和管理各种技能

实际应用：

Claude Desktop：通过MCP调用代码编辑、文件操作等技能
智能助手：集成搜索、计算、日历等多种技能
企业AI系统：标准化集成内部工具和数据源

关键点：MCP让AI从"聊天工具"升级为"智能助手"，能够真正帮你做事。

第四部分：技术方法 - RAG与Fine-tuning

9. RAG：检索增强生成

一句话解释：让AI基于事实知识回答问题。

详细说明：
RAG（Retrieval-Augmented Generation）是一种技术，让AI在生成答案前，先从知识库中检索相关信息，然后基于这些事实信息生成回答。

在这里插入图片描述

图6：RAG工作流程 - 检索知识 → 增强生成

RAG的工作流程：

用户提问
检索相关知识：从知识库中找到相关信息
结合知识与问题：将检索结果与问题结合
生成答案：基于事实信息生成回答
返回答案：提供有事实依据的回答

RAG的核心优势：

✅ 减少幻觉：基于事实知识生成，减少编造
✅ 实时更新：知识库可随时更新，保持信息新鲜
✅ 来源可溯：答案有明确出处，便于验证
✅ 专业性强：可接入专业领域知识

典型应用场景：

企业知识问答系统
智能客服（基于产品文档）
学术研究助手
法律咨询系统

10. Fine-tuning：微调

一句话解释：让通用AI模型适应特定任务。

详细说明：
Fine-tuning（微调）是在预训练好的基础模型上，使用特定领域的数据进一步训练，让模型适应特定任务或领域。

在这里插入图片描述

图7：Fine-tuning过程 - 让通用模型适应特定领域

微调的过程：

选择基础模型：如GPT-4、LLaMA等
准备微调数据：领域特定的问答对、指令等
训练调整：在基础模型上继续训练
得到专用模型：适应特定领域的模型

微调的类型：

全参数微调：调整所有模型参数
LoRA：低秩适应，高效微调
适配器：添加小型适配层
提示词微调：学习提示词嵌入

应用场景：

客服机器人（学习公司话术和产品知识）
代码助手（适应公司代码规范）
医疗助手（学习医学知识）
法律助手（理解法律条文）

关键优势：让通用模型专业化，在特定领域表现更好。

第五部分：挑战与问题 - Hallucination

11. Hallucination：幻觉

一句话解释：AI编造事实或信息。

详细说明：
Hallucination（幻觉）是指AI生成的内容看似合理，但实际上不真实、不准确或完全是编造的。
在这里插入图片描述

图8：Hallucination示例 - 事实性回答 vs 幻觉回答

幻觉示例：

问题：“Python是什么时候发布的？”
事实回答：“Python第一个公开发行版于1991年发布。”
幻觉回答：“Python是由微软公司在2005年发布的，最初叫JavaScript。”

幻觉产生原因：

训练数据问题：数据中的错误信息被学习
过度泛化：模型过度拟合训练数据中的模式
知识局限：模型不了解某些领域或最新信息
概率特性：生成式模型的本质导致可能编造

应对策略：

使用RAG：基于事实知识生成
事实核查：验证关键信息的准确性
置信度评分：标注回答的可信度
人工审核：重要内容人工验证
明确说明：让AI标注不确定的信息

重要认知：所有大模型都可能产生幻觉，这不是bug，而是生成式AI的本质特性。关键是要知道如何识别和应对。

总结与行动指南

核心概念回顾

概念	一句话解释	关键要点
AI	让机器模拟人类智能	包括机器学习、计算机视觉、NLP等多个子领域
LLM	专门处理语言的大模型	ChatGPT、Claude等都是LLM，专注语言理解和生成
Token	文本处理的基本单元	计费基础，影响处理长度和成本
Context	模型能够记忆的文本范围	上下文窗口，限制对话长度
Prompt	给AI的指令和问题	设计好的Prompt是有效使用AI的关键
Agent	能够自主行动的AI系统	结合LLM、工具、记忆和规划能力
RAG	基于事实知识的生成	减少幻觉，提高回答准确性
Fine-tuning	让模型适应特定领域	提高在专业领域的表现
Hallucination	AI编造事实	所有大模型都可能出现，需要应对策略
MCP	AI与工具交互的协议	标准化AI能力扩展
Skill	AI能够执行的特定操作	搜索、计算、文件操作等能力