Home IT技术 什么是将图像而不是潜在向量作为输入的GAN? 什么是将图像而不是潜在向量作为输入的GAN? IT技术 xiaolong · 2025年5月25日 · 0 Comment 我是一个GAN领域的新手,我知道原始的GAN是将潜在向量作为输入的。但是,如果我想完成风格转换和去除水印这样的任务,输入可能应该是图像。 这让我想到,如果我想基于原始GAN架构进行这样的工作,可能需要一个自动编码器来将图像转换为潜在向量。这是一个合理的想法吗? 现在我知道Pix2pix可能是我需要的。但是早期的GAN架构是如何完成这种“图像转换”任务的呢? 非常感谢。 回答: 有VAE-GAN,它很可能可以实现你想要的效果,你甚至可能不需要“变分”部分。你还可以看看CycleGAN。 相关文章: 在训练后的神经网络中添加更多输出神经元? 在训练神经网络的整个过程中,数据集的验证误差是否可能高于测试误差? Caffe 无论输入何种图像都预测同一类别 Caffe输出层数量对准确性的影响 一次可以向Caffe传递多少张图像? Caffe仅训练一个标签 在零中心处理中,全局平均与局部平均有何区别? 什么是机器学习中scipy.misc库的用途? vgg16微调狗猫分类在测试数据上失败 使用更大输入尺寸微调模型 computer-vision deep-learning generative-adversarial-network machine-learning neural-network