AI术语看不懂？这24个核心概念，帮你把AI底层逻辑一次讲清

如果把AI系统拆开看，本质就三件事：模型能力（Transformer + 预训练）数据与知识（Embedding + RAG）控制与执行（Prompt + Agent + 工具）你看到的所有新概念，基本都在这三层里变化。AI不是一个工具，而是一套完整的工程体系。谁理解这套体系，谁才能真正用好AI。

CeshirenTester

22人浏览 · 2026-04-09 14:11:22

CeshirenTester · 2026-04-09 14:11:22 发布

导读

现在的技术讨论里，有一个很明显的变化：

你不懂AI，不是因为不会用工具，而是听不懂“术语”。

RAG、Token、LoRA、SFT、Agent…… 这些词，已经从“研究论文”走进了“日常工作”。

很多人卡在第一步：不是不会用AI，而是根本不知道这些概念在说什么。

这篇文章，把AI里最核心的24个概念，全部拆开讲清楚。

不讲空话，只讲你能真正用上的认知框架。

一、基础认知层：AI到底是什么

大模型（LLM）

本质是一个“被海量数据训练过的预测系统”。

它不是在“理解世界”，而是在预测：下一个最合理的词是什么。

但因为数据足够多，看起来就像“会思考”。

Token

AI处理文本的最小单位。

可以理解为： AI不是按“句子”理解，而是按“碎片”处理。

中文：1个字 ≈ 1 Token
Token决定：
- 能处理多长内容
- 成本多少
- 响应速度

上下文窗口（Context Window）

AI一次“能记住多少内容”。

窗口越大：

能读更长文档
能做多轮对话
能处理复杂任务

预训练（Pretraining）

大模型的“基础教育阶段”。

通过海量数据，让模型学会：

语言规律
常识知识
基础推理能力

基座模型（Base Model）

只做了预训练，还没有“被教做人”的模型。

特点：

能力强
但不听话
不稳定

对齐（Alignment）

让模型“变得像人”。

核心目标：

不输出危险内容
符合人类价值观
更稳定、更可控

二、使用与交互层：怎么用AI

Prompt（提示词）

你给AI的“指令”。

本质不是聊天，而是：

用自然语言写程序

提示词越清晰：

输出越稳定
结果越可控

提示词工程（Prompt Engineering）

系统化设计Prompt的方法：

固定结构
补充上下文
示例驱动

本质是在做：

AI的“输入优化工程”

上下文学习（In-context Learning）

不训练模型，也能让它学新任务。

方法：

给几个示例
AI自动模仿

这也是很多AI“看起来很聪明”的原因。

思维链（CoT）

让AI“分步骤思考”。

从：

直接给答案

变成：

一步一步推理

效果：

复杂问题准确率明显提升
尤其适用于测试、分析、推理任务

AI幻觉

AI最典型的问题：

一本正经地胡说八道

常见表现：

编造数据
虚构引用
错误但自信

结论很简单：

AI输出必须可验证

三、工程与架构层：AI是怎么做出来的

Transformer

所有大模型的底层架构。

核心能力：

关注上下文关系
处理长文本

可以理解为：

AI能“理解语境”的关键技术

Embedding（词向量）

把文字变成“向量”。

作用：

相似度计算
语义搜索
知识检索

是RAG体系的核心基础。

RAG（检索增强生成）

AI不是直接回答，而是：

先查资料
再生成答案

作用：

降低幻觉
提升专业性
接入企业知识库

微调（Fine-tune）

在大模型基础上，再训练一轮。

目的：

让模型更懂某个行业
更符合特定风格

例如：

医疗AI
法律AI
客服AI

指令微调（SFT）

让模型学会：

按人类指令做事

这是模型从“能用”到“好用”的关键一步。

LoRA（低秩适配）

一种轻量级微调方案。

特点：

不改全部参数
只调整一小部分
成本低、速度快

适合：

个人或中小团队定制AI

MoE（混合专家模型）

把一个大模型拆成多个“小专家”。

不同问题调用不同专家。

优势：

更省算力
更快响应
更高性能

模型量化

对模型进行压缩。

结果：

模型更小
推理更快
可以在普通设备运行

端侧部署

把模型直接跑在本地设备。

特点：

不依赖云
隐私更安全
响应更快

开源大模型

可自由使用、修改、部署的模型。

代表：

LLaMA
Qwen
Mistral

意义：

AI能力不再被大厂垄断

四、进阶能力层：AI为什么越来越强

多模态（Multimodal）

AI不仅处理文本，还能：

看图
听声音
生成视频

本质是：

不同数据形式的统一理解能力

AI Agent（智能体）

AI不再只是回答问题，而是：

自主思考
制定计划
调用工具
执行任务

可以理解为：

会“干活”的AI系统

插件（Plugin）

让AI连接外部世界。

比如：

调接口
查数据
操作系统

本质：

给AI增加“手和脚”

最后总结

如果把AI系统拆开看，本质就三件事：

模型能力（Transformer + 预训练）
数据与知识（Embedding + RAG）
控制与执行（Prompt + Agent + 工具）

你看到的所有新概念，基本都在这三层里变化。

AI不是一个工具，而是一套完整的工程体系。

谁理解这套体系，谁才能真正用好AI。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

什么是数字员工？AI销冠系统与AI提效软件系统的核心功能有哪些？

数字员工是基于人工智能技术的销售工具，能够有效提升企业的销售效率。本文将探讨数字员工的定义及其在AI销冠系统与AI提效软件系统中的核心功能。我们将分析其多模态特性、客户服务能力及对传统销售模式的革新，为企业带来全新的业务增长机遇。

2048 AI社区

LLaMA/Bert/扩散模型微调GPU选型及租用指南

大模型微调GPU选型核心是“显存匹配模型、算力适配需求、性价比优先”，LLaMA 1B-8B、Bert-base、扩散模型基础微调，可选择RTX 3090/4090（24GB）；LLaMA 33B-70B、Bert-large、扩散模型全量微调，可选择A100 40GB/80GB。租用平台智星云，其高性价比、全卡型覆盖、环境预装、免运维的优势，适配各类微调场景，比自建省60%-80%成本；硅基引擎