大模型面经，腾讯-混元大模型面经-华5硕，差点没顶住，大模型入门学习路线与面试精要（附104G福利资源）

大模型面试全攻略：从技术面到学习路线本文详细记录了腾讯混元大模型团队4轮技术面试的全过程，涵盖大模型架构对比（MoE vs Dense）、训练推理流程、SFT/RLHF算法原理等核心知识点。面试重点考察了LoRA、DeepSpeed ZeRO等优化方法，以及强化学习在对齐中的应用，并包含多道代码题和开放性问题。文章最后提供了系统的大模型学习路线图，分为初阶应用、高阶开发、模型训练和商业落地四个阶

程序员小猴紫

762人浏览 · 2026-02-24 20:38:37

程序员小猴紫 · 2026-02-24 20:38:37 发布

本文分享了在大模型团队面试中涉及的核心知识点，包括大模型架构（如MoE与Dense对比）、训练与推理流程、SFT及RLHF的作用与算法，并探讨了强化学习在模型对齐中的应用。文章还覆盖了面试中常见的代码题和岗位相关技能，如LoRA、DeepSpeed ZeRO等优化方法。最后，提供了大模型学习路线图及丰富的学习资源，助力程序员系统学习并提升在大模型领域的竞争力。

部门与岗位：TEG - 混元大模型团队 - 大模型对齐

一面

自我介绍，过实习，讲论文，论文过的比较细，有说的笼统的地方面试官会实时进行询问交流

了解哪些大模型，简要挑一两个介绍一下，当时说了 Qwen 和 DeepSeek，然后面试官又问了这两个有什么区别

接着上一问，为什么大家都开始探索 MoE 架构，MoE 相比 Dense 有什么好处

在之前实习的时候用 LoRA 微调过 Qwen，于是问了有没有全量微调过，有没有对比过两者的性能表现

讲一下大模型训练和推理的流程，SFT 和 RLHF 的作用分别是什么

在 RLHF 中，目前主流的强化学习算法有哪几个，写一下损失函数的表达式

代码：22. 括号生成
代码：多头自注意力

一面问的八股还是比较多的，问的也比较细，而且还写了两道代码题，整个面试花的时间也比较多，大概一个半小时左右

二面

自我介绍，过实习和论文，面试官会一起进行探讨，包括工作的动机、贡献和结果，也会提一些问题和建议

之前实习用 DeepSpeed 微调过 Qwen2-72B，于是面试官问了 ZeRO-1，ZeRO-2，ZeRO-3 三个模式的区别

当时你用 DeepSpeed ZeRO-3 来微调 Qwen2-72B，每一张卡占用的显存大概是多少，估算一下为什么是占这么多的显存

除了 DeepSpeed，还用过其他的什么优化方法吗

我看你也用到了 LoRA，知道 LoRA 的原理吗，A 和 B 两个矩阵怎么初始化，有了解过其他的初始化方法吗

对 RLHF 了解的多吗

代码：3. 无重复字符的最长子串

二面更多的是结合具体的工作来问的，从用到的东西来引出问题，问的也比较灵活。当然因为部门主要是做对齐的，所以也大概聊了聊 RLHF

三面

自我介绍，挑一个觉得做的比较好的论文和实习讲一下，面试官问的比较详细，为什么选现在这种方案，为什么 work，其他方案有考虑吗

在微调 Qwen 的时候，数据是怎么构造的，有用到什么数据清洗方法吗，数据配比是怎么做的
讲一下 RLHF 的流程，之前有用 RLHF 做过模型对齐吗

在做对齐的时候，为什么 SFT 之后还要做 RLHF，只用 SFT 可以吗

知道哪些强化学习算法，除了 PPO 和 DPO 这些呢，DeepSeek 用的 GRPO 相比于 GPT 的 PPO 做了哪些改进

开放题：对目前大模型的发展有什么看法

代码：零钱的两个题 322. 零钱兑换518. 零钱兑换 II

三面面试官更聚焦于对齐这一块的内容，考的比较深。由于之前没有接触过强化学习，答得还是比较吃力的，不过面试官还挺好的，会一起讨论来做引导

四面

自我介绍，过论文和实习，问的也比较细，这里能明显的感受出来面试官的视角更系统，会把这些工作串起来问我看你简历上没写 RLHF，平常有用过 RLHF 吗

推导一下神经网络反向传播的过程一道排列组合的概率题

开放题：你觉得大模型目前还有哪些可以改进的点

四面整体更看重思维和基础，没有考察什么八股

总结

一共四轮技术面，整体来说强度比较大，对于大模型八股的考察比较细，对大模型的理解问的也比较深刻，包括一些数理逻辑基础，考察的比较全面

如何系统的学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一直在更新，更多的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

在这里插入图片描述

01.大模型风口已至：月薪30K+的AI岗正在批量诞生

在这里插入图片描述

2025年大模型应用呈现爆发式增长，根据工信部最新数据：

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K（数据来源：BOSS直聘报告）

70%企业存在"能用模型不会调优"的痛点

真实案例：某二本机械专业学员，通过4个月系统学习，成功拿到某AI医疗公司大模型优化岗offer，薪资直接翻3倍！

02.大模型 AI 学习和面试资料

1️⃣ 提示词工程：把ChatGPT从玩具变成生产工具
2️⃣ RAG系统：让大模型精准输出行业知识
3️⃣ 智能体开发：用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你：
✔️ 大厂内部LLM落地手册（含58个真实案例）
✔️ 提示词设计模板库（覆盖12大应用场景）
✔️ 私藏学习路径图（0基础到项目实战仅需90天）

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

NACHI焊接机器人智能气阀核心技术揭秘

NACHI那智焊接机器人的智能气阀系统是工业自动化领域的核心组件之一，通过高精度气体流量控制实现焊接过程的稳定性和效率提升。book.urwrpbn.cn 2-21PDF老200/Article/details/0224564615.html。book.urwrpbn.cn 2-21PDF老200/Article/details/0224415649.html。book.urwrpbn.cn 2-

2048 AI社区

大模型落地实践指南：从技术路径到企业级解决方案

大模型在企业级应用中面临技术适配、成本控制和场景匹配等核心问题。以Transformer架构为基础的预训练模型需要针对垂直领域进行微调，典型技术路径包括：模型压缩（量化、剪枝）、知识蒸馏、提示工程优化。企业需根据计算资源、数据敏感度和响应延迟要求选择7B至70B参数的模型规模。该技术框架已在多个金融和医疗客户场景验证，实现推理成本降低40%的同时保持95%以上的任务完成率。关键成功因素在于平衡模型

2048 AI社区

C++异常处理全攻略

异常安全指代码在抛出异常时仍能保持资源不泄漏、状态不破坏。RAII（Resource Acquisition Is Initialization）是实现异常安全的核心技术，通过对象的构造函数获取资源，析构函数释放资源。异常处理机制是C++错误管理的强大工具，正确使用可显著提高代码健壮性。关键字，后接任意类型的对象（内置类型、自定义类或标准库异常）。多线程中未被捕获的异常会导致程序终止。但现代编译器