【第四章:大模型（LLM)】10.微调方法与实战-(1)Prompt Tuning

PromptTuning是一种参数高效微调（PEFT）方法，通过冻结预训练大模型参数，仅在输入端添加可学习的提示向量（soft prompt）来适应下游任务。相比传统全参数微调，它极大减少了训练参数（<0.1%），存储开销低且兼容性好，但表达能力有限，适合简单任务。方法通过联合训练优化提示向量，初始化可随机或从词表选取。与PrefixTuning、LoRA等方法相比，PromptTuning

IT古董

757人浏览 · 2025-09-03 07:49:49

IT古董 · 2025-09-03 07:49:49 发布

第四章：大模型（LLM）

第十部分：微调方法与实战

第一节：Prompt Tuning

1. 背景与动机

大规模语言模型（LLM）在预训练过程中学习了通用语言知识和世界知识，但在具体下游任务（如情感分类、问答、摘要生成）中，直接使用模型往往表现不足。
传统方法如 全参数微调（Full Fine-tuning） 需要更新所有模型参数，代价昂贵且存储开销大。为此，人们提出了 参数高效微调（PEFT, Parameter-Efficient Fine-Tuning） 方法，其中 Prompt Tuning 是最早期、最具代表性的一种。

2. Prompt Tuning 的核心思想

核心理念：冻结大模型参数，只在输入端加入 可学习的提示向量（soft prompt） 来引导模型完成任务。
与手工 Prompt 的区别：
- 手工 Prompt → 通过人类编写文本提示（例如：“请判断这句话的情感是积极还是消极”）。
- Prompt Tuning → 学习一组连续的向量（embedding），模型直接将其视作输入的一部分。

3. 方法原理

冻结 LLM 参数：保持预训练好的 Transformer 权重不变。
添加可训练的 Prompt 向量：
- 在输入序列前（或中间、后部）插入 $m$ 个可学习的 embedding。
- 这些 embedding 与词向量维度相同，初始化可随机或从词表中选取。
联合训练：
- 仅更新这 $m$ 个 Prompt embedding 的参数，使用下游任务的监督信号进行优化。
- 模型前向计算时，等价于 “输入 = prompt embedding + 原始输入 embedding”。

4. Prompt Tuning 的特点

优点：
- 极大减少需要训练的参数（通常 < 0.1%）。
- 不改变原始模型结构，兼容性好。
- 存储友好（不同任务只需保存一份 Prompt 向量）。
缺点：
- 表达能力有限，尤其在小模型或复杂任务上，效果可能不如 LoRA、Adapter 等方法。
- 对 Prompt 位置、长度等较为敏感。

5. 与相关方法对比

方法	参数开销	训练方式	适用场景
Full Fine-tuning	100%	更新所有参数	高资源场景，模型可控性强
Prompt Tuning	<0.1%	学习软 Prompt embedding	少量参数更新，简单任务
Prefix Tuning	~0.1-1%	在每层输入 KV Cache 前添加可学习向量	更强表达能力
LoRA	~0.1-1%	低秩矩阵分解更新权重	复杂任务，兼容性强

6. 实战案例（PyTorch 伪代码）

import torch
import torch.nn as nn

class PromptTuningWrapper(nn.Module):
    def __init__(self, base_model, prompt_length=20, hidden_size=4096):
        super().__init__()
        self.base_model = base_model
        # 可学习的 Prompt 向量
        self.prompt_embeddings = nn.Parameter(
            torch.randn(prompt_length, hidden_size)
        )

    def forward(self, input_ids, attention_mask=None):
        # 获取原始 embedding
        inputs_embeds = self.base_model.model.embed_tokens(input_ids)
        batch_size = inputs_embeds.size(0)

        # 将 prompt 拼接到输入前
        prompt = self.prompt_embeddings.unsqueeze(0).expand(batch_size, -1, -1)
        inputs_with_prompt = torch.cat([prompt, inputs_embeds], dim=1)

        # 调用原始模型
        return self.base_model(
            inputs_embeds=inputs_with_prompt,
            attention_mask=None  # 注意 mask 要适配
        )

7. 总结

Prompt Tuning 作为参数高效微调（PEFT）的先驱方法，为 LLM 在下游任务中的快速适配提供了轻量化解决方案。
它适合 资源受限、任务较简单 的场景，是研究与教学中的入门必学方法。
但在实际应用中，随着任务复杂度提升，往往需要结合 Prefix Tuning、LoRA、Adapter 等更强大的 PEFT 技术。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Expect脚本实战：多条件匹配与防卡死技巧

在自动化测试和系统初始化中，我们常常使用 Expect 脚本来完成一系列交互操作，比如自动输入密码、监听输出并作出响应。然而，实际项目中可能遇到多步骤输出匹配的场景：只有在先匹配到某一行输出，再匹配到另一行输出时，才需要做出响应。同时，如果 “testX failed” 出现了，但 “set params error” 没有在合理时间内出现，不要卡死，而是打印警告并继续。这个写法的问题在于：如

2048 AI社区

AI模型版本控制的标签管理：架构师的技巧

在AI模型生命周期中，版本控制是保障模型可追溯性、协作效率与生产可靠性的核心环节。而标签管理作为版本控制的"语义接口"，其设计质量直接决定了团队对模型版本的理解、检索与复用能力。本文从架构师视角出发，结合第一性原理与MLOps实践，系统阐述AI模型标签管理的理论框架、架构设计、实现机制与高级考量。通过拆解标签的"唯一标识+语义描述"本质，提出四维标签模型。