梯度归一化（Gradient Normalization）

梯度归一化的核心思想是通过调整每个任务的权重，使得它们的梯度大小相对均衡。

159357zara

1390人浏览 · 2025-03-16 16:20:20

159357zara · 2025-03-16 16:20:20 发布

1. 背景

在多任务学习中，我们有多个任务（例如任务 A 和任务 B），每个任务有自己的损失函数 ${L}^{tk}$ 。为了平衡这些任务，我们需要为每个任务分配一个权重 ${w}^{tk}$ 。使得每个任务对总损失的贡献相对均衡。

2. 梯度归一化的核心思想

梯度归一化的目标是让每个任务的梯度大小（即损失函数对模型参数的导数）相对均衡。如果某个任务的梯度太大，说明它对模型的影响过大，我们需要降低它的权重；反之，如果梯度太小，则需要增加它的权重。

3. 简单例子

假设我们有两个任务：

任务 A：预测响应时间，损失函数为 ${L}^{A} 。$
任务 B：预测吞吐量，损失函数为 ${L}^{B} 。$

步骤 1：计算每个任务的梯度

计算任务 A 的梯度 $(∇LA)\ ( \nabla \mathcal{L}^A )$
计算任务 B 的梯度 $(∇LB)\ ( \nabla \mathcal{L}^B )$

步骤 2：计算每个任务的梯度范数

计算任务 A 的梯度范数 $(∣∣∇LA∥)\ (|| \nabla \mathcal{L}^A \|)$ （即梯度的长度）。
计算任务 B 的梯度范数 $(∣∣∇LB∥)\ (|| \nabla \mathcal{L}^B \|)$ 。

步骤 3：计算初始权重

假设初始权重为 $w^A = 1 )$ 和 $w^B = 1 )$ 。

步骤 4：调整权重

根据梯度范数调整权重：

如果 $(∣∣∇LA∥)\ (|| \nabla \mathcal{L}^A \|)$ 远大于 $(∣∣∇LB∥)\ (|| \nabla \mathcal{L}^B \|)$ ，说明任务 A 的梯度对模型的影响更大，我们需要降低任务 A 的权重 $w^A$ 。
反之，如果 $(∣∣∇LB∥)\ (|| \nabla \mathcal{L}^B \|)$ 更大,则降低任务 B 的权重 $w^B$ 。

具体公式可以简化为：
$w^{tk} = \frac{1}{\| \nabla \mathcal{L}^{tk} \|} ]$
这样，梯度范数越大的任务，权重越小。

步骤 5：归一化权重

为了让权重总和为 1，可以对权重进行归一化：
$w^A = \frac{w^A}{w^A + w^B}, \quad w^B = \frac{w^B}{w^A + w^B} ]$

4. 具体计算示例

假设：

任务 A 的梯度范数 $\| \nabla \mathcal{L}^A \| = 5)$ 。
任务 B 的梯度范数 $\| \nabla \mathcal{L}^B \| = 2)$ 。

计算初始权重：

$w^A = \frac{1}{5} = 0.2, \quad w^B = \frac{1}{2} = 0.5 ]$

归一化权重：

$w^A = \frac{0.2}{0.2 + 0.5} = \frac{0.2}{0.7} \approx 0.29 ]$
$w^B = \frac{0.5}{0.2 + 0.5} = \frac{0.5}{0.7} \approx 0.71 ]$

结果：

任务 A 的权重为 0.29。
任务 B 的权重为 0.71。

5. 总结

梯度归一化的核心思想是通过调整每个任务的权重，使得它们的梯度大小相对均衡。具体步骤包括：

计算每个任务的梯度。
计算每个任务的梯度范数。
根据梯度范数调整权重。
归一化权重，使其总和为 1。

通过这种方法，模型可以更好地平衡多个任务，避免某个任务主导训练过程。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2026工作手机系统好的企业

2048 AI社区

Linux 环境下静态链接库 (.a) & 动态链接库 (.so) 完整实例（含嵌入式适配）

静态库 (.a)gcc -c 生成.o→ar rcs 打包为.a→gcc 编译测试程序 -I/-L/-l；特性：无外部依赖、体积大、更新需重编译，嵌入式首选；动态库 (.so)gcc -c -fPIC 生成.o→gcc -shared 生成.so→gcc 编译测试程序 -I/-L/-l -Wl,-rpath；特性：依赖外部库、体积小、支持热更新，PC/Linux 服务器首选；嵌入式适配只需替换为

2048 AI社区

RegexBox：让正则表达式变得简单，AI 驱动的正则工具箱

正则表达式曾经是开发者的噩梦，但现在，有了 RegexBox，它将成为你的得力助手！🤖AI 加持：不会写？让 AI 帮你写📚模板丰富：不想写？直接用模板⚡实时测试：写错了？立即看到结果📖规则速查：忘记了？内置参考手册不再为正则表达式而烦恼，专注于你的核心业务逻辑！🚀 立即体验 RegexBox，让正则表达式变得简单！让我们告别"复制粘贴式"的正则表达式开发，拥抱 AI 时代的编程体验！本文