【GANs】什么是饱和损失函数 Non-Saturating LossFunction

在设定GAN的损失函数时，总会有文献说Saturating和Non-Saturating Loss functions，具体他们各是什么，以及为什么这么称呼呢？一句话总结：非饱和损失函数能在训练早期提供更大的梯度我们首先看一下两种的数学表达式饱和Loss：生成器希望最小化被判断为假的概率min⁡log⁡(1−D(G(z)))(1)\min \log(1-D(G(z))) \tag{1}minlog

yzy_1996

5879人浏览 · 2021-01-15 11:03:50

yzy_1996 · 2021-01-15 11:03:50 发布

在设定GAN的损失函数时，总会有文献说Saturating和Non-Saturating Loss functions，具体他们各是什么，以及为什么这么称呼呢？

一句话总结：非饱和损失函数能在训练早期提供更大的梯度

我们首先看一下两种的数学表达式

饱和Loss：生成器希望最小化被判断为假的概率
$\min \log(1-D(G(z))) \tag{1}$
非饱和Loss：生成器希望最大化被判断为真的概率
$\max \log(D(G(z))) \tag{2}\\ \text{or} \min -\log(D(G(z)))$

后者能提供的梯度信息更好，为什么呢？

在训练的初始阶段， $G$ 生成的样本很容易被 $D$ 识别出来，也就是 $D (G (z))$ 趋近于0，此时饱和GAN的 Loss_G 的梯度会很小，所以饱和了。而非饱和GAN的 Loss_G 的梯度会大很多，能够为网络的权重更新提供好的梯度方向，帮助收敛，所以没饱和。

在这里插入图片描述
图来自于
A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

企业AI项目如何赚钱？资深架构师的回报分析方法论

AI 驱动的软件产品许多企业开发基于 AI 的软件解决方案，如智能客服系统、图像识别软件、数据分析工具等，然后将这些产品直接销售给其他企业或个人用户。例如，一家公司开发了一款利用 AI 技术进行精准营销的软件，通过分析客户数据来制定个性化的营销方案。其他企业购买这款软件后，可以提高营销效率，增加销售额。该软件公司通过收取软件授权费、订阅费等方式实现盈利。# 简单示例：模拟精准营销软件中的客户数据分