在使用tf.layers.conv2d_transpose
时,输出张量形状是由什么定义的?
例如:如果输入是4x4x512,要使输出变为8x8x256,可以给定滤波器,但高度和宽度是如何定义的?还是说输出高度和宽度总是输入的两倍?
谢谢。
回答:
查看这个回答,它提供了一个公式来回答你的问题。https://stackoverflow.com/a/43624992/7431458
从上面的内容来看,输出形状是由步长、填充、核形状和输入形状定义的。你还需要设置输出形状参数,让Tensorflow知道预期的形状,因为上述链接中提到了某些特殊情况。
要更好地理解转置卷积的作用,请查看这里:
https://towardsdatascience.com/types-of-convolutions-in-deep-learning-717013397f4d