收藏备用！AI大模型14个核心概念全解析，小白与程序员入门必备

本文系统性梳理了现代AI大模型技术栈的14个核心概念，覆盖从底层架构到上层应用的全链路知识：以Transformer、Token、嵌入模型筑牢技术基础，以预训练、微调、MoE优化模型能力，以RAG、AI Agent拓展应用边界，以对齐技术、提示工程、幻觉处理保障应用安全可控，最后通过MCP、A2A、Agentic RL推动大模型向自主协作、通用智能演进。这些概念并非孤立存在，而是相互关联、层层递进

黑帽子唐哥

680人浏览 · 2026-01-24 14:40:20

黑帽子唐哥 · 2026-01-24 14:40:20 发布

本文系统梳理了AI大模型领域的14个核心概念，从支撑模型运行的基础架构（如Transformer、Token、嵌入模型），到优化模型性能的训练技术（预训练、微调、模型对齐、幻觉处理），再到驱动前沿应用的关键模式（提示工程、RAG、AI Agent、MCP、A2A、Agentic RL）。这些概念环环相扣、层层递进，构成了完整的现代大模型技术全景图，既能帮助小白快速搭建知识框架，也能为程序员深耕大模型领域提供核心参考，为后续学习、开发与应用筑牢基础。

一、大模型基础架构与核心组件

1、Transformer[1]架构

Transformer架构是当前主流大模型的技术基石，其诞生直接推动了自然语言处理（NLP）领域的范式革新，无论是GPT系列、LLaMA还是国产大模型，均以此为核心衍生迭代。

该架构由Google于2017年在《Attention Is All You Need》论文中提出，彻底摒弃了传统RNN、LSTM的序列式处理逻辑，核心依托自注意力机制实现并行计算，不仅大幅提升了模型训练效率，还让长文本语义理解能力实现质的飞跃。

Transformer 模型架构

Transformer的核心创新集中在位置编码和多头注意力机制两大模块：

**位置编码：**通过将词嵌入向量与可学习的位置向量叠加，让模型同时捕捉词义信息与词序关系。相较于早期简单的索引式位置标记，这种编码方式有效避免了文本长度增加导致的数值不稳定问题，适配更长上下文的处理需求。

**多头注意力机制：**通过多个并行的注意力“头”从不同维度解析文本关联，每个注意力头专注于捕捉文本局部或全局的特定关系（如语义依赖、语法结构），最终将多视角特征融合，形成更全面、精准的语义表征。

小贴士：对于程序员而言，理解这两大机制是自定义Transformer变体、优化模型性能的关键，建议结合PyTorch/TensorFlow的官方实现代码拆解学习。

Transformer模型的自注意力机制的公式：

2、Token

Token是大模型处理自然语言的最小语义单位，相当于AI理解语言的“基础音节”，大模型的所有文本处理流程均以Token序列为输入展开，其拆分逻辑直接影响模型的计算成本、上下文窗口利用率及功能设计。例如，GPT-4标准版的上下文窗口为128k Token，这一指标直接决定了其单次可处理的文本长度上限（约对应10万字中文内容）。

不同模型的Token拆分规则存在差异：部分模型会将“人工智能”这类高频词合并为1个Token，而部分模型则会拆分为“人工”“智能”两个子词，甚至进一步拆分。在实际开发中，Token数量直接关联API调用成本（如GPT-4输入Token与输出Token收费标准不同），同时也会影响模型推理速度，因此程序员在设计超长文档处理、对话机器人等功能时，需提前规划Token分配策略，必要时通过文本截断、摘要压缩等方式控制Token用量。

主流分词方法分为三类：

词级（Word-level）：以完整单词为拆分单位，优点是语义完整性强，易于人类理解，但会面临词汇表膨胀、未登录词（Out-of-Vocabulary, OOV）过多的问题，适配小语种或专业领域时效果较差。
字符级（Character-level）：以单个字符为单位拆分，完全规避OOV问题，但会割裂语义信息，导致序列长度激增，大幅降低计算效率，仅适用于部分低资源语言场景。
子词级（Subword-level）：当前大模型的主流分词方案，在词级与字符级之间取得平衡。核心逻辑是将高频词保留为完整Token，罕见词拆分为有语义的子词片段（如“量子计算”拆分为“量子”+“计算”，“石墨烯”拆分为“石墨”+“烯”），既能有效解决OOV问题，又能兼顾语义完整性与计算效率。

主流子词算法包括BPE（Byte Pair Encoding）、WordPiece和SentencePiece等，其核心逻辑均是通过对大规模语料库进行统计分析，迭代合并高频字符对或子词，最终构建出大小适中、适配性强的词汇表。其中，BPE是GPT系列采用的分词算法，WordPiece被BERT系列使用，SentencePiece则支持多语言分词场景。

对中文分词的影响：由于中文无天然空格分隔符，Token化效率对模型性能影响更为显著。早期中文大模型多以单个汉字为1个Token，导致处理相同语义的中文文本比英文消耗更多Token，增加了计算成本与上下文限制压力。目前国产大模型（如通义千问、文心一言）通过优化分词器词典，扩充中文高频词、短语条目，实现1个Token表示多汉字语义，大幅提升了中文处理效率。

3、嵌入模型(Embedding Model)

嵌入模型（Embedding Model）的核心作用是将文本、图像、音频等非结构化数据，转化为计算机可运算的低维稠密数值向量，这种向量不仅能压缩数据维度，更能保留原始数据的语义信息——向量空间中“距离”越近，代表原始数据的语义相似度越高，这是大模型实现语义理解、检索匹配的核心底层能力。例如，“猫”与“狗”的向量距离远小于“猫”与“汽车”，模型据此可判断三者的语义关联程度。

在实际开发中，嵌入模型是诸多大模型应用的“隐形支柱”，典型场景包括：

文档问答产品的内容检索：将用户问题与文档片段分别转化为向量，通过余弦相似度计算快速匹配最相关内容，提升回答准确性。
电商/内容平台的相似推荐：基于商品描述、文章内容的向量相似度，实现个性化推荐功能。
RAG技术的核心检索环节：作为RAG架构的基础组件，将知识库内容转化为向量存储于向量数据库，为生成式回答提供事实依据。

小贴士：小白入门可优先使用开源嵌入模型（如BGE、m3e）搭建简单检索场景，程序员可结合LangChain、Milvus向量数据库实现端到端嵌入检索流程。

4、混合专家模型(MoE)

**混合专家模型[2]（Mixture of Experts, MoE）**是一种基于稀疏激活机制的神经网络架构，核心设计是通过门控网络（Gating Network）根据输入内容动态选择部分“专家子网络”参与计算，而非激活全部参数。

MoE的核心优势的是实现“高参数容量与低计算成本”的平衡：通过仅激活总参数的10%-20%处理输入，既能大幅提升模型的参数规模（突破万亿级）以增强能力，又能避免全参数激活带来的算力消耗，是当前超大模型（如GPT-4、PaLM 2）的核心架构之一。

MoE的工作机制可类比为项目团队协作：门控网络扮演“项目经理”角色，根据任务特性（如输入是代码、文本还是图像）筛选出最适配的几位“专家子网络”（如擅长代码生成、语义理解的子网络）协同工作，最后整合各专家输出形成最终结果。这种分治策略让模型能同时适配多场景任务，且无需承担全参数模型的算力压力。

二、大模型训练与优化方法

5、预训练(Pretraining)

预训练是大模型构建通用能力的基础阶段，本质是通过自监督学习从海量无标注数据中学习语言规律、世界知识与语义表征，过程不针对任何特定任务，核心目标是让模型掌握“通用语言能力”。这一阶段就像学生广泛阅读书籍积累基础知识，为后续专项学习打下基础。

预训练的核心特点是依赖海量低成本无标注数据（如互联网文本、书籍、论文等），通过自回归预测、掩码语言建模等任务让模型自主学习数据中的统计规律与语义关联，形成可迁移的通用知识。

预训练的通用流程包括四步：

a) 采集并清洗大规模无标注训练数据，过滤噪声、有害信息，确保数据多样性与质量；

b) 选择适配的自监督任务（自回归/自编码），让模型从数据中学习共性规律；

c) 将学习到的通用语义表征与知识“固化”到模型参数中，形成预训练基座模型；

d) 通过模型压缩、蒸馏等技术优化预训练模型，平衡性能与部署成本。

**扩展定律（Scaling Laws[3]）**是指导预训练的核心理论，由OpenAI与DeepMind研究团队提出，该定律指出：大模型的性能（以损失函数值衡量）与模型参数量（N）、训练数据量（D）、计算量（C）之间存在可预测的幂律关系，即三者按比例提升时，模型性能会稳步增长。

DeepMind的“Chinchilla[4]”论文进一步修正了这一认知：为实现计算最优配置，模型参数量与训练Token量需按比例同步增加（参数翻倍时，训练Token量也需翻倍），打破了早期“唯参数论”的认知，强调数据量与数据质量对预训练效果的同等重要性。这一结论为企业与开发者规划预训练资源提供了重要依据，避免盲目追求大参数量而忽视数据建设。

6、微调(Fine-tuning)

微调是在预训练基座模型基础上，针对特定任务或领域优化模型性能的过程，核心是通过少量高质量标注数据，让模型将通用知识迁移到具体场景中，实现从“通用能力”到“实用价值”的转化，是大模型落地应用的关键步骤。

根据算力资源与场景需求，微调技术主要分为三类，开发者可按需选择：

全参数微调：更新模型所有参数，能最大程度适配目标任务，效果最优，但计算成本极高（需GPU集群支持），仅适用于资源充足、任务复杂度高的场景。
基于适配器的微调：在预训练模型的Transformer层间插入小型可训练适配器（Adapter）模块，仅更新适配器参数，保留预训练模型的核心知识，大幅降低计算开销。
基于低秩矩阵分解的微调：以LoRA、LoHa、AdaLoRA为代表，通过对模型权重矩阵进行低秩分解，仅训练分解后的低秩矩阵参数，参数量可减少至全参数微调的1%以下，是当前中小团队与个人开发者的主流选择。

7、模型对齐(Alignment)

模型对齐是确保大模型输出符合人类价值观、伦理规范及特定业务目标的技术体系，核心解决大模型“能力强但输出不可控”的问题——即模型虽能生成流畅内容，但可能存在偏见、有害信息、偏离任务目标等问题，是大模型安全可靠落地的核心保障。

**基于人类反馈的强化学习（RLHF）**是当前实现模型对齐最成熟、有效的方法，其核心逻辑是通过人类偏好引导模型优化输出，整体分为三个核心步骤：

监督微调（Supervised Fine-Tuning, SFT）：使用少量高质量人类示范数据（如符合需求的指令-回答对）微调预训练模型，让模型初步掌握遵循指令、适配人类表达习惯的能力。
训练奖励模型（Reward Model, RM）：让模型对同一指令生成多个不同回答，由人类标注员按偏好排序（优质回答得分高，劣质回答得分低），基于这些排序数据训练奖励模型，使其能自动为模型输出打分，替代人工判断。
强化学习优化（RL with PPO）：将奖励模型作为反馈信号，采用近端策略优化（PPO）算法进一步微调SFT模型，让模型持续生成能获得更高奖励分的内容，逐步对齐人类偏好。

对齐的挑战与替代方案：RLHF的局限性在于流程复杂、依赖大量高质量人工标注，成本极高。为此，研究人员提出了更高效的替代方案，其中**直接偏好优化（Direct Preference Optimization, DPO）**应用最广——它跳过奖励模型训练环节，直接利用人类偏好数据调整模型参数，流程更简洁、训练更稳定，且计算成本仅为RLHF的1/3，已成为中小规模模型对齐的首选方案。

安全评估：对齐效果需通过全面评估验证，常用方法包括：基于PKU-SafeRLHF、TruthfulQA等基准数据集，测试模型在有害性、事实准确性、偏见等维度的表现；采用红队测试（Red Teaming）主动模拟恶意输入，挖掘模型的安全漏洞，提前修补优化。

8、大模型幻觉

**幻觉（Hallucination）**是大模型生成内容时的核心痛点，指模型生成看似逻辑通顺、表达流畅，但与事实不符、凭空捏造或存在误导性的内容，严重影响大模型在医疗、法律、金融等对准确性要求高的领域的应用。

幻觉产生的核心原因：大模型本质是基于训练数据中的统计模式生成内容，而非“真正理解”信息——它无法区分事实与虚构，仅追求输出的流畅性与连贯性。具体诱因包括：训练数据存在噪声或错误、模型知识滞后（无法获取实时信息）、推理能力不足、上下文过长导致信息遗忘等。

幻觉的检测与缓解技术：

检测方法：目前主流检测思路包括两种，一是通过量化模型输出的不确定性（如语义熵、概率分布离散度），识别低置信度内容；二是采用自洽性验证（让模型以不同方式回答同一问题，若答案不一致则大概率存在幻觉）。

缓解策略（开发者重点关注）：

数据层面：优化预训练与微调数据，清洗错误、重复信息，补充高质量事实性数据。
技术层面：集成RAG技术，将模型回答锚定在可靠外部知识库上，从源头减少虚构内容。
生成策略：调整模型解码参数（如降低温度值temperature），减少随机生成，避免过度“创造”。
验证机制：引入链式验证（Chain-of-Verification），让模型生成回答后自动生成验证问题，核查原始答案准确性并修正。

9、提示工程(Prompt Engineering)

提示工程是通过设计精准、结构化的提示文本，引导大模型高效输出符合需求内容的技术——无需修改模型参数，仅通过优化输入方式就能提升模型性能，是小白与开发者低成本挖掘大模型能力的核心手段。

提示工程的分类与实用设计方法：

任务性提示：明确指定任务类型与要求，避免模糊表述，例如“请为以下技术文档生成300字摘要，重点提炼核心算法与应用场景”。
示例性提示（Few-Shot/Zero-Shot）：提供1-3个参考案例，引导模型模仿输出格式与风格，适合格式要求严格的场景（如代码生成、数据格式化）。
限定性提示：明确约束输出范围、格式或风格，例如“使用JSON格式输出结果，包含名称、类型、描述三个字段，语言简洁专业”。
角色扮演提示：为模型设定具体角色，强化输出的专业性，例如“你是资深Python后端工程师，针对以下问题仅输出可运行代码，无需解释”。

万能提示词公式（收藏备用）：提示词=角色+核心指示+背景信息+输出要求+输入内容。例如金融分析场景：“角色：资深金融分析师；指示：分析某公司2025年三季报盈利能力；背景：结合行业平均水平与政策影响；输出要求：结构化报告，含核心指标、优势与风险；输入内容：[财报文本]”。

三、大模型进阶技术与应用模式

10、检索增强生成(RAG)

**RAG（检索增强生成）**是融合“检索能力”与“生成能力”的核心技术，核心解决大模型幻觉、知识滞后、专业领域知识不足三大痛点，通过调用外部知识库为模型生成内容提供事实依据，是当前大模型落地的主流架构之一，也是AI Agent的核心组件。

RAG的标准三步工作流程（开发者可直接落地）：

索引构建：收集专业文档、知识库等数据，进行文本分块（优化检索精度），通过嵌入模型转化为向量，存储于Milvus、Pinecone等向量数据库中。
相似检索：用户输入查询后，将查询文本转化为向量，与向量数据库中的内容计算相似度，匹配出Top N最相关的文本片段。
增强生成：将用户查询与匹配到的事实片段一同输入大模型，让模型基于事实内容生成回答，确保输出的准确性与时效性。

典型应用包括ChatPDF（文档问答工具）、企业知识库问答系统、智能客服等，让大模型从“凭记忆回答”升级为“引经据典回答”。对于开发者而言，RAG是低代码落地大模型应用的优先选择，可基于LangChain、LlamaIndex框架快速搭建原型。

11、AI Agent(智能体)

**AI Agent（大模型智能体）**是以大语言模型为核心驱动，具备自主感知需求、拆解任务、调用工具、记忆信息、迭代优化能力的智能系统，能端到端完成复杂目标任务，代表了大模型应用的下一代发展方向，是智能化软件的新形态。

Agent技术架构：并非单一模型，而是一套集成框架，核心组件包括大模型（决策中枢）、专家模型（如代码生成、图像识别模型）、工具集（搜索引擎、API、数据库）、知识库、记忆模块（短期上下文记忆、长期知识记忆）。其中大模型负责核心决策：理解用户意图、拆分复杂任务、调度工具、整合结果。

Agent工作流程（以软件开发场景为例）：用户提出“开发一个简单的图书管理系统”需求后，Agent首先拆解任务为“需求分析→架构设计→代码编写→测试调试→部署文档生成”，随后分别调用产品经理角色Agent、程序员Agent、测试工程师Agent协同工作，每个子Agent完成对应任务后反馈结果，最终整合输出完整系统与文档，全程无需人工干预。

12、模型上下文协议(MCP)

**MCP（模型上下文协议）**是连接大模型与外部工具、系统的标准化信息传递协议，核心价值是打破大模型与外部工具的接口壁垒——开发者无需为每个工具单独编写适配代码，通过MCP就能让大模型无缝调用API、数据库、第三方服务，实现从“只能生成文本”到“能执行具体操作”的跨越。

MCP的核心特点：

标准化接口：统一封装各类工具的调用逻辑，大模型通过固定格式指令即可调用不同工具，降低开发成本。
高效低延迟：优化数据传输格式与通信逻辑，减少模型与工具间的交互延迟，适配实时应用场景。
高可扩展性：支持动态添加工具、更新协议版本，便于功能迭代与多场景适配。
多平台兼容：无缝适配LangChain、Hugging Face、OpenAI API等主流大模型开发框架，降低集成难度。

MCP的工作机制：

初始化阶段：启动客户端并连接MCP服务器，获取当前可用工具列表及调用规范。
查询处理阶段：用户输入查询后，宿主应用将查询内容与上下文信息传递给MCP服务器。
LLM决策阶段：大模型分析用户意图，生成符合MCP规范的工具调用指令（含工具类型、参数）。
工具执行阶段：MCP服务器转发指令至目标工具，执行后返回结果。
结果整合阶段：大模型处理工具返回结果，生成最终响应反馈给用户。

13、Agent-to-Agent协议(A2A)

A2A（Agent-to-Agent）协议是Google于2025年推出的智能体间交互标准，核心目标是解决不同AI系统（异构Agent）的通信障碍，实现跨平台、跨类型智能体的无缝协作，打破AI应用的信息孤岛。

A2A协议的核心功能：

能力自动发现：每个Agent通过JSON格式的“Agent Card”声明自身能力（如任务类型、输入输出格式、权限范围），其他Agent可通过A2A协议自动识别并匹配协作对象。
全场景任务管理：支持短时快速任务（如单次查询）、长时复杂任务（如多步骤项目开发），能自动分配任务优先级、跟踪执行进度。
结构化协作通信：Agent间通过标准化消息格式传递上下文、中间结果、任务指令，确保信息传递准确无歧义，支持异步、同步协作。
高兼容性与安全性：基于HTTP、SSE、JSON-RPC等通用协议构建，适配绝大多数AI框架与硬件环境；同时内置权限管控、数据加密机制，保障协作安全。

A2A协议的两种核心协作架构：

链式协作：采用接力模式，上一个Agent的输出作为下一个Agent的输入，适用于流程化任务（如“文本翻译→摘要生成→格式排版”）。
集中式调度：由主Agent（调度者）统一接收任务、拆分子任务、分配给不同专业Agent，最后汇总结果，适用于复杂协同任务（如多角色项目开发）。

14、Agentic-RL

传统LLM-RL范式将大模型视为“静态条件生成器”，仅能基于输入生成输出，缺乏自主决策与环境交互能力；而**Agentic RL（智能体强化学习）**则将大模型重构为“动态自主智能体”，使其具备在复杂动态环境中自主感知、推理、规划、调用工具的闭环能力，是大模型向通用人工智能（AGI）迈进的关键技术。

Agentic RL的核心是为大模型构建“感知→规划→行动→反思”的闭环机制：感知环节获取环境与任务信息，规划环节拆分目标与行动步骤，行动环节调用工具执行操作，反思环节评估结果并优化后续策略。这种机制让大模型从“被动响应输入”转变为“主动达成目标”，能适配更复杂的动态场景（如自主开发软件、智能运维、科学实验设计）。

从理论层面，Agentic RL可形式化为部分可观测马尔可夫决策过程（POMDP），通过状态感知、动作选择、奖励反馈的循环迭代，让智能体逐步优化决策策略，提升复杂任务的完成能力。

写在最后

这些概念并非孤立存在，而是相互关联、层层递进，共同构成了当前大模型技术的完整全景图。对于小白而言，掌握这些基础概念能快速打通大模型知识脉络，避免陷入“只知其然不知其所以然”的困境；对于程序员与开发者，深入理解这些概念是实现模型优化、架构设计、场景落地的前提，也是把握大模型技术红利的核心。

大模型技术仍处于高速迭代期，新的架构、算法与协议不断涌现，建议大家收藏本文作为学习手册，结合开源项目（如LangChain、LLaMA）动手实践，在理论与实操结合中深化理解。未来，随着技术的持续突破，这些概念也将不断演进，共同推动人工智能迈向更智能、更可控、更普惠的新阶段。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线科技企业深耕十二载，见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事，早已在效率与薪资上形成代际优势，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包：

✅ 从零到一的 AI 学习路径图
✅ 大模型调优实战手册（附医疗/金融等大厂真实案例）
✅ 百度/阿里专家闭门录播课
✅ 大模型当下最新行业报告
✅ 真实大厂面试真题
✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ，朋友们如果有需要 《AI大模型入门+进阶学习资源包》，下方扫码获取~
在这里插入图片描述

① 全套AI大模型应用开发视频教程

（包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点）
在这里插入图片描述

② 大模型系统化学习路线

作为学习AI大模型技术的新手，方向至关重要。正确的学习路线可以为你节省时间，少走弯路；方向不对，努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划，带你从零基础入门到精通！
在这里插入图片描述

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档，我精选了一系列大模型技术的书籍和学习文档（电子版），它们由领域内的顶尖专家撰写，内容全面、深入、详尽，为你学习大模型提供坚实的理论基础。
在这里插入图片描述

④ AI大模型最新行业报告

2025最新行业报告，针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。
在这里插入图片描述

⑤ 大模型项目实战&配套源码

学以致用，在项目实战中检验和巩固你所学到的知识，同时为你找工作就业和职业发展打下坚实的基础。
在这里插入图片描述

⑥ 大模型大厂面试真题

面试不仅是技术的较量，更需要充分的准备。在你已经掌握了大模型技术之后，就需要开始准备面试，我精心整理了一份大模型面试题库，涵盖当前面试中可能遇到的各种技术问题，让你在面试中游刃有余。

以上资料如何领取？

在这里插入图片描述

为什么大家都在学大模型？

最近科技巨头英特尔宣布裁员2万人，传统岗位不断缩减，但AI相关技术岗疯狂扩招，有3-5年经验，大厂薪资就能给到50K*20薪！

不出1年，“有AI项目经验”将成为投递简历的门槛。

风口之下，与其像“温水煮青蛙”一样坐等被行业淘汰，不如先人一步，掌握AI大模型原理+应用技术+项目实操经验，“顺风”翻盘！
在这里插入图片描述

这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。
在这里插入图片描述