AI大模型微调教程（超详细）35个经典面试问题从入门到精通，一篇全掌握！建议收藏

训练 loss 突然跳高但又下降。

小敢摘葡萄

709人浏览 · 2025-12-31 11:37:15

小敢摘葡萄 · 2025-12-31 11:37:15 发布

文章针对测试开发人员解答大模型微调的35个经典问题，涵盖显存需求、SFT微调、数据构建、预训练等技术要点。强调大模型微调已成为AI时代测试开发核心竞争力，推荐使用LoRA/QLoRA而非从零训练，关注数据质量和评测集构建。文章指出测试开发需关注大模型功能评估、质量评测、训练监控等能力，实现从传统测试向AI测试转型。

从事测试开发同学这两年跳槽，会越来越频繁遇到“大模型微调”类问题。很多人第一反应是：我平时写 UI 自动化、搞接口压测，怎么突然和模型训练扯上关系了？

现实就是，AI 已经渗透进测试领域：质量评估、数据生成、智能测试、甚至大模型测试本身，都需要对微调机制、预训练逻辑、指令数据构造有基本理解。

下面整理了一份涵盖 35 个经典微调面试问题的技术解读帮助你在面试里不被问懵。

全参数微调到底要多少显存？

取决于模型大小和训练配置。简单记一条经验：显存 ≈ 参数量 × 2～3 倍（训练时会有梯度、优化器状态等额外开销）。比如 70B 模型，基本不考虑本地，只能上集群。

测试开发常问：为什么显存这么夸张？因为训练时不是“推理那么轻松”，而是要反向传播、保存梯度、优化器状态，天然三倍体积。

为什么很多人做完 SFT 感觉模型“变傻”？

SFT（有监督微调）容易让模型“过度跟随数据”，如果数据质量不均、指令风格太窄，模型会失去原有的探索能力，生成模式单一。类似你做接口自动化时，只给脚本喂固定场景，脚本当然学不会异常情况。

SFT 的指令数据怎么构建？

关键不在量，而在指令覆盖度和风格一致性。一个常见模式是：

指令：给出任务  输入：补充信息（可空）  输出：模型应该生成的内容

对测试开发来说，可以构建一些更贴近业务的：缺陷分析、性能瓶颈定位解释、日志推理等任务。

Continue Pretrain（继续预训练）的领域数据如何选？

越“接近真实业务越好”。比如电商行业模型，就喂商品描述、客服对话、订单结构化数据。测试行业模型，就喂用例、日志、缺陷描述、排查步骤、指标规范等。

领域训练后通用能力下降怎么解决？

这叫“遗忘”。常用方法：

混入部分通用数据
使用低学习率
训练后做一次轻量 SFT 拉回能力

就像你把接口压测工具完全调成只适应某一服务，换个微服务就废了，模型也是同理。

Continue Pretrain 如何让模型学到更多知识？

不仅仅靠“喂更多数据”。重点在于：

数据要干净
覆盖要均匀
格式要稳定
通过分阶段训练逐步学习

SFT 时选 Base 还是 Chat 模型？

SFT 本质是再训练模型的行为模式。如果你是做指令对齐，通常选 Base；如果是轻量领域增强，直接在 Chat 上继续训更高效。

领域微调的数据格式要求？

保持结构清晰、风格稳定、一致性强。模型比你想得“更敏感”，格式乱一点，训练效果立刻下降。

领域模型的评测集怎么构建？

评测集是给模型的“期末考试卷子”。必须来自真实任务，例如：

性能指标分析
测试设计推理
日志异常定位
API 失败原因判断
测试方案对比

覆盖“模型未来要承担的能力”。

是否需要扩词表？

中文场景有必要，比如：

行业专有名词
编程语言 token
测试领域术语

扩词表能减少“拆字”，提升模型理解能力。

如何训练自己的大模型？

如果不是机构级别，建议从 LoRA / QLoRA + SFT 入手，而不是从零训练。从零训练 = 数据贵、算力贵、效果不稳定。

中文大模型训练经验有哪些？

中文要注意：

切词方式
标点风格
多样体裁（口语/书面）
行业术语覆盖

否则训出来的模型像“语文课代表”。

指令微调有什么好处？

让模型学会“怎么回答人”，而不是“知道什么”。类似测试开发里给脚本写公共框架，行为更一致、更稳定。

知识是在预训练还是微调阶段注入的？

预训练注入“知识”；微调注入“行为”。一个是大脑，一个是习惯。

想让模型学某行业知识，用预训练还是微调？

依赖知识密度。大量领域知识 → continue pretrain。任务形态（怎么回答） → SFT。

多轮对话任务怎么微调？

适配「上下文关联」，数据一般是：

用户：...助手：...用户：...助手：...

训练时保持对话链条连续。

灾难性遗忘是什么？

模型为了学新知识，把旧知识“挤掉”。类似你把接口压测脚本改成只跑压测，功能验证相关逻辑会自动退化。

微调模型需要多大显存？

LoRA（8～24GB）、QLoRA（12GB 也能练）、全参数（64GB 起步甚至更高）。

SFT 时模型到底在学什么？

学“任务模式”。比如回答风格、格式、逻辑结构，而不是百科知识。

预训练与 SFT 有什么不同？

预训练：摄入全世界的文本 SFT：学会怎么当一个有用的助手

样本量增大导致 OOM？

通常是因为：

batch size 设置过大
序列长度拉满
优化器状态占用爆炸

SFT 如何优化样本？

主要是：

去掉重复
去掉风格冲突
去掉噪声
删除无意义的回答冗余

数据越干净，模型越聪明。

模型参数的迭代实验怎么做？

常见方式：

切不同学习率
调 LoRA rank
不同指令模板
混域 vs 纯域训练

记录每次实验的评测指标非常关键。

微调的一些经验建议

简单说，别“一把梭”。模型训练就像性能调优：反复试、慢慢调、逐步验证。

batch size 太小的影响？

梯度不稳定，收敛慢，模型易随机发散。

batch size 太大的影响？

显存容易爆，模型容易“平均化”，变得呆板。

batch size 如何设置？

通常根据显存、序列长度反推。不够就使用梯度累积。

优化器怎么选择？

常见的是 AdamW、Lion。小模型 AdamW 大多够用。

哪些因素影响显存使用？

模型大小、batch size、序列长度、LoRA 或全参、优化器状态。

领域预训练用哪些数据集？

根据行业选择：技术文档、API 文档、日志样例、缺陷描述、测试用例等。

微调数据集如何构建？

围绕真实任务构建，覆盖高频业务场景，让模型“能用”。

大模型训练 loss 出现突刺怎么办？

32.1 什么是 loss 突刺？

训练 loss 突然跳高但又下降。

32.2 为什么出现？

数据脏、极端样本、学习率太大、batch 太小。

32.3 如何解决？

降学习率、清洗数据、调 batch、缩序列长度。

大模型微调特别注意点

作为测试开发，你需要更关注以下方向：

怎么评估大模型的功能正确性（可控性、稳定性）
怎么构建大模型的质量评测集
领域数据采样、清洗、分类
模型的日志分析、训练监控
性能指标：吞吐、显存、迭代速度
如何发现训练中的“模式坍缩”和“模式漂移”

这些能力正在成为“AI时代的测试开发核心竞争力”。

大模型不是玄学，它越来越像微服务一样，可以拆解、监控、测试、优化。

如何学习AI大模型？

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过AI大模型的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。（全套教程文末领取哈）
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。
在这里插入图片描述

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。（全套教程文末领取哈）

在这里插入图片描述

👉4.大模型实战项目&项目源码👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战项目来学习。（全套教程文末领取哈）
在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。（全套教程文末领取哈）
在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。（全套教程文末领取哈）
在这里插入图片描述

为什么分享这些资料?

只要你是真心想学AI大模型，我这份资料就可以无偿分享给你学习，我国在这方面的相关人才比较紧缺，大模型行业确实也需要更多的有志之士加入进来，我也真心希望帮助大家学好这门技术，如果日后有什么学习上的问题，欢迎找我交流，有技术上面的问题，我是很愿意去帮助大家的！

这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

在这里插入图片描述