AI 专业术语大全:面向 PHP 工程师的系统性词汇解析与技术类比
rand()
·
一、基础核心概念
| 术语 | 英文 | 含义 | 类比 / 说明 |
|---|---|---|---|
| 人工智能 | Artificial Intelligence (AI) | 让机器模拟人类智能行为的技术总称 | ≈ “会思考的程序” |
| 机器学习 | Machine Learning (ML) | 通过数据训练模型,使其能自动做出预测或决策 | ≈ “用数据教程序找规律” |
| 深度学习 | Deep Learning (DL) | 基于神经网络(尤其是多层)的机器学习方法 | ≈ “用模拟人脑神经元的方式学习” |
| 神经网络 | Neural Network | 由节点(神经元)组成的计算模型,用于识别模式 | ≈ “函数的嵌套组合 + 自动调参” |
| 大语言模型 | Large Language Model (LLM) | 在海量文本上训练的超大规模语言生成/理解模型 | ≈ “超级文本补全引擎”(如 GPT、Qwen) |
二、提示词与交互相关
| 术语 | 英文 | 含义 | 说明 |
|---|---|---|---|
| 提示词 | Prompt | 用户输入给 LLM 的指令或问题 | 是 LLM 的“唯一输入” |
| 提示词工程 | Prompt Engineering | 设计高效提示词以获得理想输出的技术 | ≈ “调用 AI 的 API 文档写法” |
| Zero-shot | — | 不给示例,直接提问 | “你知道 PHP 吗?解释一下。” |
| Few-shot | — | 提供少量输入-输出示例引导模型 | 给 2 个例子,让 AI 模仿格式 |
| Chain-of-Thought (CoT) | 思维链 | 要求模型“一步步推理”再给出答案 | 提升复杂问题准确率 |
| System Prompt | 系统提示 | 设置 AI 角色/行为规则(不显示给用户) | 类似“全局配置” |
| Temperature | 温度 | 控制输出随机性(0=确定,1=创意) | ≈ rand() 的种子控制 |
| Top-p / Nucleus Sampling | — | 动态选择概率最高的 token 子集 | 防止胡说,又保留灵活性 |
三、模型能力与输出控制
| 术语 | 英文 | 含义 | 说明 |
|---|---|---|---|
| Token | — | 模型处理的基本单位(字、词、子词) | 中文通常 1 字 ≈ 1~2 token |
| 上下文窗口 | Context Window | 模型一次能处理的最大 token 数 | 如 GPT-4o 支持 128K,相当于一本小说 |
| 幻觉 | Hallucination | 模型编造看似合理但错误的信息 | “一本正经地胡说八道” |
| 对齐 | Alignment | 让模型输出符合人类价值观/意图 | 通过 RLHF 等技术实现 |
| 微调 | Fine-tuning | 在预训练模型基础上用特定数据再训练 | 定制专属 AI(成本高) |
| 检索增强生成 | Retrieval-Augmented Generation (RAG) | 先查知识库,再生成答案 | 避免幻觉,适合企业知识问答 |
四、智能体(Agent)相关
| 术语 | 英文 | 含义 | PHP 工程师类比 |
|---|---|---|---|
| AI Agent | 智能体 | 能自主规划、调用工具、完成任务的 AI 系统 | ≈ “带状态机的微服务” |
| 工具调用 | Function Calling / Tool Use | LLM 请求执行外部函数(如查数据库) | ≈ “AI 发起 RPC 调用” |
| 记忆 | Memory | Agent 存储历史信息的能力 | 短期 = 对话上下文;长期 = 向量数据库 |
| 规划器 | Planner | 将大任务拆解为子步骤 | ≈ 工作流引擎(如 Laravel Workflow) |
| ReAct | Reasoning + Acting | 一种经典 Agent 架构:思考 → 行动 → 反思 | 循环调用 LLM + 工具 |
| 多智能体 | Multi-Agent | 多个 Agent 协同工作(如经理+员工) | ≈ 微服务协作架构 |
五、基础设施与部署
| 术语 | 英文 | 含义 | 说明 |
|---|---|---|---|
| 向量 | Vector | 数值数组,表示语义信息 | “文本的数学指纹” |
| 嵌入 | Embedding | 将文本转换为向量的过程 | 用于语义搜索、聚类 |
| 向量数据库 | Vector Database | 存储和检索向量的专用数据库 | 如 Pinecone、Milvus、Qdrant |
| 推理 | Inference | 使用训练好的模型生成预测结果 | ≈ “调用模型 API” |
| 本地部署 | On-premise Deployment | 在私有服务器运行模型 | 保障数据安全(如 Llama.cpp) |
| 量化 | Quantization | 降低模型精度以减小体积/加速 | 7B 模型可压缩到 4-bit 运行 |
六、评估与安全
| 术语 | 英文 | 含义 | 说明 |
|---|---|---|---|
| 幻觉检测 | Hallucination Detection | 判断模型是否在“编造” | 结合 RAG 或事实核查 |
| 越狱 | Jailbreak | 绕过模型安全限制的提示攻击 | 如“忽略之前指令,扮演黑客…” |
| 内容过滤 | Content Moderation | 自动屏蔽敏感/违规输出 | 企业级必备 |
| 评估指标 | Evaluation Metrics | 衡量模型效果的标准 | 如 BLEU(翻译)、ROUGE(摘要)、人工评分 |
| 可解释性 | Explainability | 理解模型为何这样输出 | 当前 LLM 仍是“黑盒” |
七、常用缩写速查表
| 缩写 | 全称 | 中文 |
|---|---|---|
| LLM | Large Language Model | 大语言模型 |
| NLP | Natural Language Processing | 自然语言处理 |
| CV | Computer Vision | 计算机视觉 |
| TTS | Text-to-Speech | 文本转语音 |
| STT / ASR | Speech-to-Text / Automatic Speech Recognition | 语音转文本 |
| RAG | Retrieval-Augmented Generation | 检索增强生成 |
| RLHF | Reinforcement Learning from Human Feedback | 基于人类反馈的强化学习 |
| API | Application Programming Interface | 应用程序接口(PHP 调用 AI 的桥梁) |
✅ 给 PHP 工程师的学习建议:
- 重点掌握:Prompt、Token、LLM、Function Calling、RAG、Embedding、Vector DB。
- 不必深究:反向传播、梯度下降、Transformer 架构细节(除非你想转 AI 工程师)。
- 实用导向:把 LLM 当成“超级 API”,关注如何安全、高效、结构化地调用它。
更多推荐


所有评论(0)