我正在构建一个DCGAN,并且在输出形状上遇到了问题,当我尝试计算BCELoss时,它与标签的形状不匹配。
为了生成判别器输出,我必须一直使用卷积层吗?还是可以在某个点添加一个线性层来匹配我想要的形状?
我的意思是,我必须通过添加更多的卷积层来减少形状,还是可以添加一个全连接层?我以为它应该有一个全连接层,但我在检查的每个教程中,判别器都没有全连接层。
...
我得到的错误是:
...
输出的形状为:torch.Size([1, 1, 13, 13])
,标签的形状为:torch.Size([1])
。
回答:
DCGAN描述了一个具体的架构,其中使用卷积层来对特征图进行下采样。如果你仔细设计你的卷积层,你可以不使用线性层,但这并不意味着使用线性层来下采样(特别是作为最后一层)不会工作。DCGAN论文只是发现使用卷积层而不是线性层进行下采样效果更好。
如果你想保持这个架构,你可以更改卷积层的核大小、填充或步长,以使最后一层恰好得到一个单一的值。请参考Pytorch关于卷积层的文档,了解给定输入大小时输出大小应为多少。