从公式看对抗逻辑：揭秘生成对抗网络（GAN）的训练博弈之路

从公式到训练过程，GAN的核心魅力在于**“对抗式共同进化”**——判别器在“打假”中更敏锐，生成器在“造假”中更逼真。正是这种博弈，让GAN能生成以假乱真的内容，在艺术创作、数据增强等领域大放异彩。下次再看到AI生成的惊艳作品时，不妨想想背后这对“猫鼠搭档”在公式min⁡Gmax⁡DVDGEx∼pdataxlog⁡DxEz∼pzzlog⁡1−DGzGminDmaxVDGEx∼pdatax

安意诚Matrix

633人浏览 · 2025-11-04 00:00:00

安意诚Matrix · 2025-11-04 00:00:00 发布

从公式到对抗：揭秘生成对抗网络（GAN）的训练博弈之路

如果你对AI生成的逼真图像、视频甚至文字有所了解，那一定听说过**生成对抗网络（GAN）**的名号。它的核心魅力，都藏在下面这个看似复杂的公式里：

$\min_G \max_D V(D, G) = \mathbb{E}_{x \sim p_{\text{data}}(x)} \left[ \log D(x) \right] + \mathbb{E}_{z \sim p_z(z)} \left[ \log(1 - D(G(z))) \right]$

今天，我们就从这个公式出发，一步步拆解GAN的训练逻辑，看看这对“对抗搭档”是如何在博弈中共同成长的。

一、公式拆解：GAN的“对抗战场”

这个公式是GAN的目标函数，它定义了生成器 $G$ 和判别器 $D$ 之间的“博弈规则”：

1. 博弈逻辑： $min_G \max_D$

这是极小极大博弈的体现：

先让判别器 $D$ 最大化目标（拼命“打假辨真”）；
再让生成器 $G$ 最小化目标（拼命“以假乱真”）。

2. 价值函数： $V (D, G)$ 的两重对抗

$V (D, G)$ 是两者对抗的“战场”，由两部分期望损失组成：

（1）真实样本项： $Ex∼pdata(x)[log⁡D(x)]\mathbb{E}_{x \sim p_{\text{data}}(x)} \left[ \log D(x) \right]$

$Ex∼pdata(x)\mathbb{E}_{x \sim p_{\text{data}}(x)}$ ：对真实数据分布 $pdata(x)p_{\text{data}}(x)$ 取期望， $x$ 是真实样本（如真实照片、文本）。
$D (x)$ ：判别器对真实样本的输出，取值 $(0, 1)$ ，表示“ $x$ 是真实样本”的概率。
$log⁡D(x)\log D(x)$ ：若 $D (x)$ 接近1（判别器准确识别真实样本），该项接近0；若 $D (x)$ 接近0（判别器误判真实样本为假），该项趋向 $−∞-\infty$ 。
意义：判别器希望这一项越大越好。

（2）生成样本项： $Ez∼pz(z)[log⁡(1−D(G(z)))]\mathbb{E}_{z \sim p_z(z)} \left[ \log(1 - D(G(z))) \right]$

$Ez∼pz(z)\mathbb{E}_{z \sim p_z(z)}$ ：对噪声分布 $p_z(z)$ 取期望， $z$ 是随机噪声（如高斯分布向量）。
$G (z)$ ：生成器将噪声转化为“假样本”（如假照片、假文本），试图模仿真实数据。
$D (G (z))$ ：判别器对生成样本的输出，表示“ $G (z)$ 是真实样本”的概率。
$log⁡(1−D(G(z)))\log(1 - D(G(z)))$ ：若 $D (G (z))$ 接近0（判别器准确识别假样本），该项接近0；若 $D (G (z))$ 接近1（判别器误判假样本为真），该项趋向 $−∞-\infty$ 。
意义：判别器希望这一项越大越好，生成器希望这一项越小越好。

简言之，这个公式就是一场“猫鼠游戏”：判别器 $D$ 是“猫”，要最大化“辨真假”能力；生成器 $G$ 是“鼠”，要最小化 $D$ 的能力，让“假老鼠”骗过猫。

二、训练过程：交替对抗的“成长循环”

GAN的训练遵循**“先练猫，再练鼠，循环往复”**的逻辑：

阶段1：训练判别器 $D$ （固定生成器 $G$ ）

目标：让 $D$ 尽可能“聪明”，区分真实样本和生成样本。

采样真实样本：从真实数据集中选一批样本 $x$ ，计算 $Ex∼pdata(x)[log⁡D(x)]\mathbb{E}_{x \sim p_{\text{data}}(x)} \left[ \log D(x) \right]$ 。
生成假样本：从噪声分布中选一批噪声 $z$ ，用当前 $G$ 生成假样本 $G (z)$ ，计算 $Ez∼pz(z)[log⁡(1−D(G(z)))]\mathbb{E}_{z \sim p_z(z)} \left[ \log(1 - D(G(z))) \right]$ 。
更新 $D$ 的参数：将两项损失相加，通过梯度上升（最大化 $V (D, G)$ ）更新 $D$ 的神经网络参数。

阶段2：训练生成器 $G$ （固定判别器 $D$ ）

目标：让 $G$ 尽可能“狡猾”，生成能骗过 $D$ 的假样本。

生成假样本：从噪声分布中选一批噪声 $z$ ，用 $G$ 生成假样本 $G (z)$ 。
计算生成器损失：关注生成样本项 $Ez∼pz(z)[log⁡(1−D(G(z)))]\mathbb{E}_{z \sim p_z(z)} \left[ \log(1 - D(G(z))) \right]$ ，通过梯度下降（最小化 $V (D, G)$ ）更新 $G$ 的神经网络参数。
- （实战优化：为了训练更稳定，常将损失替换为 $−Ez∼pz(z)[log⁡D(G(z))]-\mathbb{E}_{z \sim p_z(z)} \left[ \log D(G(z)) \right]$ ，梯度更显著）

循环迭代

重复“训练 $D$ → 训练 $G$ ”的过程，直到生成器能生成足够逼真的样本（或达到预设轮数）。

三、训练中的“攻防细节”

GAN的训练并非一帆风顺，这些细节决定了它的“战斗力”：

判别器的“强度平衡”：
- 若 $D$ 太强（对生成样本输出恒为0），生成器梯度会消失，无法学习；
- 若 $D$ 太弱（对真假样本判断无差异），生成器也学不到有效“造假技巧”。
梯度消失问题：生成器早期生成的样本很“假”，导致 $log⁡(1−D(G(z)))\log(1 - D(G(z)))$ 梯度极小。用 $−log⁡D(G(z))-\log D(G(z))$ 替代损失可缓解这一问题。
模式崩溃：生成器可能只生成少数“爆款假样本”（而非多样本）。可通过架构改进（如DCGAN、StyleGAN）或训练策略（小批量判别、引入噪声）来解决。

四、结语：对抗中的“共同进化”

从公式到训练过程，GAN的核心魅力在于**“对抗式共同进化”**——判别器在“打假”中更敏锐，生成器在“造假”中更逼真。正是这种博弈，让GAN能生成以假乱真的内容，在艺术创作、数据增强等领域大放异彩。

下次再看到AI生成的惊艳作品时，不妨想想背后这对“猫鼠搭档”在公式 $\min_G \max_D V(D, G) = \mathbb{E}_{x \sim p_{\text{data}}(x)} \left[ \log D(x) \right] + \mathbb{E}_{z \sim p_z(z)} \left[ \log(1 - D(G(z))) \right]$ 定义的战场上，经历了多少次交替训练的博弈吧！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

硅基造物行业篇—AI与toG

2048 AI社区

STM32程序卡死后，点3下全速运行居然活了？这坑90%嵌入式er都踩过！

摘要：STM32程序卡死需点3次全速运行才能启动的"玄学"问题，根源在于默认启用的半主机模式。当程序使用printf等标准I/O函数时，会通过调试器与主机通信，若调试器未准备好就会阻塞。解决方法包括：1) 删除printf；2) 启用MicroLIB并重定向fputc至串口；3) 完全重写标准库I/O函数。该问题暴露了嵌入式开发中默认配置不匹配、main函数前的隐藏初始化代码、

2048 AI社区

Aardvark：用 GPT-5 赋能代码安全防御的智能体研究员

Aardvark 是一个自主 AI 智能体，其功能是像人类安全研究员一样思考，并能大规模运作。连续分析源代码仓库，尤其是对提交（Commit）级别的代码变更进行扫描。评估所发现漏洞的实际可利用程度，并根据严重性进行优先级排序。对发现的漏洞进行分步解释，并对代码进行注释，方便人工审查。集成，为每个漏洞提供一个经过 Aardvark 扫描的、可供人工一键审查和应用的补丁。除了安全漏洞，在测试中发现 A