GAN生成器的损失函数

我深入研究了GAN,并在PyTorch中实现了它,现在我正在研究GAN背后的核心统计学,当我查看那个网站 GAN背后的数学时,它提到

“Loss(G) = – Loss(D),请注意,我们将生成器的成本定义为判别器成本的负值。这是因为我们没有明确的方法来评估生成器的成本。”

但是在实现GAN时,我们定义生成器的损失为:

二进制交叉熵损失,这是生成器生成的图像和真实标签之间的判别器输出,在原始论文和以下代码中(由我实现和测试)

    # 训练生成器    z_ = to.randn(minibatch,100 ).view(-1, 100, 1, 1)    z_ = Variable(z_.cuda())    gen_images = generator(z_)    D_fake_decisions = discriminator(gen_images).squeeze()    G_loss = criterion(D_fake_decisions,real_labels)    discriminator.zero_grad()    generator.zero_grad()    G_loss.backward()    opt_Gen.step()

请解释这两者之间的区别,以及正确的那个

代码链接 : https://github.com/mabdullahrafique/Gan_with_Pytorch/blob/master/DCGan_mnist.ipynb

谢谢


回答:

判别器的工作是执行二元分类,以区分真实和假的,因此它的损失函数是二元交叉熵。

生成器的工作是进行密度估计,从噪声到真实数据,并将其输入判别器以欺骗它。

设计中采用的方法是将其建模为MinMax游戏。现在让我们看一下成本函数:

来源: https://towardsdatascience.com/generative-adversarial-networks-history-and-overview-7effbb713545

有人解释说:

J(D)中的第一项代表将实际数据输入判别器,判别器希望最大化预测为1的对数概率,表示数据是真实的。第二项代表由G生成的样本。在这里,判别器希望最大化预测为0的对数概率,表示数据是假的。另一方面,生成器试图最小化判别器正确预测的对数概率。这个问题的解决方案是游戏的均衡点,即判别器损失的鞍点。

由于判别器试图将生成器样本的概率最大化为零,生成器的工作就变成了最大化为一。这相当于将生成器的成本函数设为负交叉熵,其中J(D)中的第一项现在是常数。

来源: https://towardsdatascience.com/generative-adversarial-networks-history-and-overview-7effbb713545

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注