我深入研究了GAN,并在PyTorch中实现了它,现在我正在研究GAN背后的核心统计学,当我查看那个网站 GAN背后的数学时,它提到
“Loss(G) = – Loss(D),请注意,我们将生成器的成本定义为判别器成本的负值。这是因为我们没有明确的方法来评估生成器的成本。”
但是在实现GAN时,我们定义生成器的损失为:
二进制交叉熵损失,这是生成器生成的图像和真实标签之间的判别器输出,在原始论文和以下代码中(由我实现和测试)
# 训练生成器 z_ = to.randn(minibatch,100 ).view(-1, 100, 1, 1) z_ = Variable(z_.cuda()) gen_images = generator(z_) D_fake_decisions = discriminator(gen_images).squeeze() G_loss = criterion(D_fake_decisions,real_labels) discriminator.zero_grad() generator.zero_grad() G_loss.backward() opt_Gen.step()
请解释这两者之间的区别,以及正确的那个
代码链接 : https://github.com/mabdullahrafique/Gan_with_Pytorch/blob/master/DCGan_mnist.ipynb
谢谢
回答:
判别器的工作是执行二元分类,以区分真实和假的,因此它的损失函数是二元交叉熵。
生成器的工作是进行密度估计,从噪声到真实数据,并将其输入判别器以欺骗它。
设计中采用的方法是将其建模为MinMax游戏。现在让我们看一下成本函数:
有人解释说:
J(D)中的第一项代表将实际数据输入判别器,判别器希望最大化预测为1的对数概率,表示数据是真实的。第二项代表由G生成的样本。在这里,判别器希望最大化预测为0的对数概率,表示数据是假的。另一方面,生成器试图最小化判别器正确预测的对数概率。这个问题的解决方案是游戏的均衡点,即判别器损失的鞍点。
由于判别器试图将生成器样本的概率最大化为零,生成器的工作就变成了最大化为一。这相当于将生成器的成本函数设为负交叉熵,其中J(D)中的第一项现在是常数。
来源: https://towardsdatascience.com/generative-adversarial-networks-history-and-overview-7effbb713545