AI术语看不懂?这24个核心概念,帮你把AI底层逻辑一次讲清
如果把AI系统拆开看,本质就三件事:模型能力(Transformer + 预训练)数据与知识(Embedding + RAG)控制与执行(Prompt + Agent + 工具)你看到的所有新概念,基本都在这三层里变化。AI不是一个工具,而是一套完整的工程体系。谁理解这套体系,谁才能真正用好AI。
导读
现在的技术讨论里,有一个很明显的变化:
你不懂AI,不是因为不会用工具,而是听不懂“术语”。
RAG、Token、LoRA、SFT、Agent…… 这些词,已经从“研究论文”走进了“日常工作”。
很多人卡在第一步: 不是不会用AI,而是根本不知道这些概念在说什么。
这篇文章,把AI里最核心的24个概念,全部拆开讲清楚。
不讲空话,只讲你能真正用上的认知框架。
目录
-
基础认知层(AI到底是什么)
-
使用与交互层(怎么用AI)
-
工程与架构层(AI是怎么做出来的)
-
进阶能力层(AI为什么越来越强)
一、基础认知层:AI到底是什么
大模型(LLM)
本质是一个“被海量数据训练过的预测系统”。
它不是在“理解世界”, 而是在预测:下一个最合理的词是什么。
但因为数据足够多,看起来就像“会思考”。
Token
AI处理文本的最小单位。
可以理解为: AI不是按“句子”理解,而是按“碎片”处理。
-
中文:1个字 ≈ 1 Token
-
Token决定:
-
能处理多长内容
-
成本多少
-
响应速度
-
上下文窗口(Context Window)
AI一次“能记住多少内容”。
窗口越大:
-
能读更长文档
-
能做多轮对话
-
能处理复杂任务
预训练(Pretraining)
大模型的“基础教育阶段”。
通过海量数据,让模型学会:
-
语言规律
-
常识知识
-
基础推理能力
基座模型(Base Model)
只做了预训练,还没有“被教做人”的模型。
特点:
-
能力强
-
但不听话
-
不稳定
对齐(Alignment)
让模型“变得像人”。
核心目标:
-
不输出危险内容
-
符合人类价值观
-
更稳定、更可控
二、使用与交互层:怎么用AI
Prompt(提示词)
你给AI的“指令”。
本质不是聊天,而是:
用自然语言写程序
提示词越清晰:
-
输出越稳定
-
结果越可控
提示词工程(Prompt Engineering)
系统化设计Prompt的方法:
-
固定结构
-
补充上下文
-
示例驱动
本质是在做:
AI的“输入优化工程”
上下文学习(In-context Learning)
不训练模型,也能让它学新任务。
方法:
-
给几个示例
-
AI自动模仿
这也是很多AI“看起来很聪明”的原因。
思维链(CoT)
让AI“分步骤思考”。
从:
直接给答案
变成:
一步一步推理
效果:
-
复杂问题准确率明显提升
-
尤其适用于测试、分析、推理任务
AI幻觉
AI最典型的问题:
一本正经地胡说八道
常见表现:
-
编造数据
-
虚构引用
-
错误但自信
结论很简单:
AI输出必须可验证
三、工程与架构层:AI是怎么做出来的
Transformer
所有大模型的底层架构。
核心能力:
-
关注上下文关系
-
处理长文本
可以理解为:
AI能“理解语境”的关键技术
Embedding(词向量)
把文字变成“向量”。
作用:
-
相似度计算
-
语义搜索
-
知识检索
是RAG体系的核心基础。
RAG(检索增强生成)
AI不是直接回答,而是:
-
先查资料
-
再生成答案
作用:
-
降低幻觉
-
提升专业性
-
接入企业知识库
微调(Fine-tune)
在大模型基础上,再训练一轮。
目的:
-
让模型更懂某个行业
-
更符合特定风格
例如:
-
医疗AI
-
法律AI
-
客服AI
指令微调(SFT)
让模型学会:
按人类指令做事
这是模型从“能用”到“好用”的关键一步。
LoRA(低秩适配)
一种轻量级微调方案。
特点:
-
不改全部参数
-
只调整一小部分
-
成本低、速度快
适合:
个人或中小团队定制AI
MoE(混合专家模型)
把一个大模型拆成多个“小专家”。
不同问题调用不同专家。
优势:
-
更省算力
-
更快响应
-
更高性能
模型量化
对模型进行压缩。
结果:
-
模型更小
-
推理更快
-
可以在普通设备运行
端侧部署
把模型直接跑在本地设备。
特点:
-
不依赖云
-
隐私更安全
-
响应更快
开源大模型
可自由使用、修改、部署的模型。
代表:
-
LLaMA
-
Qwen
-
Mistral
意义:
AI能力不再被大厂垄断
四、进阶能力层:AI为什么越来越强
多模态(Multimodal)
AI不仅处理文本,还能:
-
看图
-
听声音
-
生成视频
本质是:
不同数据形式的统一理解能力
AI Agent(智能体)
AI不再只是回答问题,而是:
-
自主思考
-
制定计划
-
调用工具
-
执行任务
可以理解为:
会“干活”的AI系统
插件(Plugin)
让AI连接外部世界。
比如:
-
调接口
-
查数据
-
操作系统
本质:
给AI增加“手和脚”
最后总结
如果把AI系统拆开看,本质就三件事:
-
模型能力(Transformer + 预训练)
-
数据与知识(Embedding + RAG)
-
控制与执行(Prompt + Agent + 工具)
你看到的所有新概念,基本都在这三层里变化。
AI不是一个工具,而是一套完整的工程体系。
谁理解这套体系,谁才能真正用好AI。
更多推荐

所有评论(0)