我有一个表示图像的一维Tensorflow张量。最初我有一个形状为(2, 2, 3)的RGB图像,但当数据传到我的模型时,它已经被标准化、转换为灰度并展平了。
我试图重构图像,以便在其上运行一些卷积操作。我尝试了不同的方法来重塑、压缩和扩展它,但我无法将其调整为conv2d所需的四维数组形状。
以下是我使用的代码。
import tensorflow as tf# 这原本是一个2x2的RGB图像,后来被转换为灰度并展平tf_1d_input = tf.Variable([0.1, 1.0, 2.0, 3.0]) tf_4d_reshape = tf.reshape(tf_1d_input, [1, 2, 2, 1])tf_conv_layer = tf.nn.conv2d(tf_4d_reshape, (3,3), [1, 1, 1, 1], 'SAME')with tf.Session() as sess: sess.run(tf.global_variables_initializer()) print(tf.rank(tf_4d_reshape)) sess.run(tf_conv_layer)# ValueError: Shape must be rank 4 but is rank 1 for 'Conv2D' (op: 'Conv2D') with input shapes: [1,2,2,1], [2].
我是否遗漏了某个步骤,或者我只是不理解reshape的作用/conv2d的期望是什么。
回答:
在tensorflow中,conv2d
的filter参数必须是一个对应于卷积权重的张量,而不是卷积大小。
tf_1d_input = tf.Variable([0.1, 1.0, 2.0, 3.0]) tf_4d_reshape = tf.reshape(tf_1d_input, [1, 2, 2, 1])w = tf.zeros([3, 3, 1, 10])tf_conv_layer = tf.nn.conv2d(tf_4d_reshape, w, [1, 1, 1, 1], 'SAME') # 不再报错
当然,上面的例子虽然可以运行,但并不实用。你可以在tf教程中找到更多关于如何使用初始化器初始化权重的具体例子,例如这个关于MNIST的教程。