大模型微调：让你的GPT/Gemini/Qwen从通才变专家（收藏版）

大模型微调技术解析摘要：本文探讨了通用大模型在专业领域应用时的局限性，并介绍了两种微调方法：全参数微调(FFT)和参数高效微调(PEFT)。FFT通过调整所有参数实现高性能但成本高，而PEFT(特别是LoRA方法)通过训练少量额外参数显著降低计算成本。文章详细对比了两种方法的优缺点，并提供了完整的代码实现示例，包括模型加载、训练配置和保存过程，为开发者提供了实用的技术参考。（字数：149）

乔代码嘚

156人浏览 · 2026-02-10 09:59:09

乔代码嘚 · 2026-02-10 09:59:09 发布

通用大模型虽强，但在专业领域应用时存在领域不匹配、任务不聚焦、风格与约束等问题。微调是解决这些问题的关键，能将大模型从“通才”变为“专家”。文章介绍了全参数微调和参数高效微调（PEFT，特别是LoRA）两种主流方法，对比了它们的优缺点和适用场景，并提供了代码实现示例，帮助程序员快速掌握大模型微调技术。

Why 微调

以 GPT、Gemini、Qwen 为代表的大模型，已经具备了通用语言理解与生成能力，但在真实业务中，我们往往会遇到三个问题：

1 领域不匹配：专业领域如金融、法律、生物信息等，术语密集、表达规范，大模型只能“懂个大概”，但不够专业。

2 任务不聚焦：有时候我们希望模型稳定地完成某一类或几类任务（如分类、代码补全），而不是“什么都会一点”。

3 风格与约束：通用大模型的回复格式、语气、推理路径、合规要求，往往需要被“教会”，而不是靠 prompt 碰运气。

那么这时候，我们就需要微调（Fine-tuning）来让大模型“从通才变专家”。

大模型微调的分类

一

Full Fine-tuning（全参数微调）

全参数微调，顾名思义，就是模型的所有参数都参与反向传播，所有参数都进行调整，本质是在原模型基础上“整体再训练一遍”，更像“重塑一个新模型”。其特点如下：

理论性能上限最高
不需要在模型里引入额外结构
计算和存储成本高
容易过拟合 / 灾难性遗忘

PEFT（Parameter-Efficient Fine-Tuning，参数高效微调）

PEFT，与FFT相比，并不更新模型的所有参数，其冻结原模型参数，而额外只训练少量额外参数。众多PEFT方法中，LoRA（Low-Rank Adaptation）是目前最主流、工程上最成熟的方案。与FFT相比，特点如下：


	Full Fine-tuning	LoRA（PEFT）
需训练参数	100%	通常 <1%
训练成本	非常高	显著降低
小数据稳定性	较差	很好
多任务扩展	困难	容易

代码的实现

二

Full Fine-tuning

#1 加载预训练模型
model = torch.load(args.pretrain_checkpoint)
model = model.to(device)
#超参数
#---  Prepare Optimizer ---#
optimizer = optim.Adam(model.parameters(), lr=args.lr, amsgrad=True)
#---  Prepare Scheduler ---#
scheduler = StepLR(optimizer, step_size=args.gamma_step, gamma=args.gamma)
#2 准备微调训练集
my_trainset = SCDataset(train_rna, train_protein, args.enc_max_seq_len, args.dec_max_seq_len)
my_testset = SCDataset(test_rna, test_protein, args.enc_max_seq_len, args.dec_max_seq_len)
train_loader = torch.utils.data.DataLoader(my_trainset, **train_kwargs, drop_last=True, sampler=train_sampler)
test_loader = torch.utils.data.DataLoader(my_testset, **test_kwargs, drop_last=True,  sampler=test_sampler)
#3 FFT训练
for epoch in range(start_epoch+1, args.epochs + 1):
torch.cuda.empty_cache()
train_loss, train_ccc = train(args, model, device, train_loader, optimizer, epoch)
scheduler.step()
#4 保存最终模型
model.save_pretrained("./full_ft/final_model")

Low-Rank Adaptation (LoRA)

from peft import LoraConfig, get_peft_model
# =========================
# 1. 加载预训练模型
# =========================
model = torch.load(args.pretrain_checkpoint)
model = model.to(device)
# ===== 新增：LoRA 配置 =====
lora_config = LoraConfig(
r=8,
lora_alpha=32,
lora_dropout=0.1,
bias="none",
task_type="SEQ_2_SEQ_LM",
target_modules=["q_proj", "v_proj"]
)
# ===== 新增：包装为 PEFT / LoRA 模型 =====
model = get_peft_model(model, lora_config)
# 可选但强烈推荐：确认只有 LoRA 在训练
model.print_trainable_parameters()
# =========================
# 超参数,准备优化器 & Scheduler
# =========================
optimizer = optim.Adam(
filter(lambda p: p.requires_grad, model.parameters()),
lr=args.lr,
amsgrad=True
)
scheduler = StepLR(
optimizer,
step_size=args.gamma_step,
gamma=args.gamma
)
# =========================
# 2. 准备微调训练集
# =========================
my_trainset = SCDataset(
train_rna,
train_protein,
args.enc_max_seq_len,
args.dec_max_seq_len
)
my_testset = SCDataset(
test_rna,
test_protein,
args.enc_max_seq_len,
args.dec_max_seq_len
)
train_loader = torch.utils.data.DataLoader(
my_trainset,
**train_kwargs,
drop_last=True,
sampler=train_sampler
)
test_loader = torch.utils.data.DataLoader(
my_testset,
**test_kwargs,
drop_last=True,
sampler=test_sampler
)
# =========================
# 3. PEFT（LoRA）训练（流程不变）
# =========================
for epoch in range(start_epoch + 1, args.epochs + 1):
torch.cuda.empty_cache()
train_loss, train_ccc = train(
args,
model,
device,
train_loader,
optimizer,
epoch
)
scheduler.step()
# =========================
# 4. 保存最终模型（LoRA adapter）
# =========================
model.save_pretrained("./lora_adapter")

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述