我在TensorFlow中训练模型如下:
batch_size = 128graph = tf.Graph()with graph.as_default():# 输入数据。对于训练数据,我们使用一个占位符,在运行时将通过训练小批量数据进行填充。tf_train_dataset = tf.placeholder(tf.float32, shape=(batch_size, image_size * image_size))tf_train_labels = tf.placeholder(tf.float32, shape=(batch_size, num_labels))tf_valid_dataset = tf.constant(valid_dataset)tf_test_dataset = tf.constant(test_dataset)# 变量。weights = tf.Variable( tf.truncated_normal([image_size * image_size, num_labels]))biases = tf.Variable(tf.zeros([num_labels]))# 训练计算。logits = tf.matmul(tf_train_dataset, weights) + biasesloss = tf.reduce_mean( tf.nn.softmax_cross_entropy_with_logits(labels=tf_train_labels, logits=logits))# 优化器。optimizer = tf.train.GradientDescentOptimizer(0.5).minimize(loss)# 对训练、验证和测试数据的预测。train_prediction = tf.nn.softmax(logits)valid_prediction = tf.nn.softmax( tf.matmul(tf_valid_dataset, weights) + biases)test_prediction = tf.nn.softmax(tf.matmul(tf_test_dataset, weights) + biases)num_steps = 3001with tf.Session(graph=graph) as session: tf.global_variables_initializer().run() print("Initialized") for step in range(num_steps): # 在训练数据中选择一个偏移量,该数据已被随机化。 # 注意:我们可以在各个周期中使用更好的随机化方法。 offset = (step * batch_size) % (train_labels.shape[0] - batch_size) # 生成一个小批量数据。 batch_data = train_dataset[offset:(offset + batch_size), :] batch_labels = train_labels[offset:(offset + batch_size), :] # 准备一个字典,告诉会话在哪里填充小批量数据。 # 字典的键是图形中要填充的占位符节点, # 值是要填充给它的numpy数组。 feed_dict = {tf_train_dataset : batch_data, tf_train_labels : batch_labels} _, l, predictions = session.run( [optimizer, loss, train_prediction], feed_dict=feed_dict) if (step % 500 == 0): print("Minibatch loss at step %d: %f" % (step, l)) print("Minibatch accuracy: %.1f%%" % accuracy(predictions, batch_labels)) print("Validation accuracy: %.1f%%" % accuracy( valid_prediction.eval(), valid_labels)) print("Test accuracy: %.1f%%" % accuracy(test_prediction.eval(), test_labels))
现在我想使用单张图像作为输入,将其调整为与训练图像相同的格式,并获得10个类别的预测概率。这个问题已经被问过多次,我很难理解他们的解决方案,其中一个最佳答案是使用以下代码:
feed_dict = {x: [your_image]}classification = tf.run(y, feed_dict)print classification
在我的代码中,x和y的等价物是什么?假设我从测试数据集中选择一张图像进行预测,如下所示:
img = train_dataset[678]
我期望得到一个包含10个概率的数组。
回答:
让我来回答自己的问题:首先,必须更改这些代码行,我们必须使用None代替常量批量大小,以便稍后可以将单张图像作为输入进行填充:
tf_train_dataset = tf.placeholder(tf.float32, shape=(None, image_size * image_size),name="train_to_restore")tf_train_labels = tf.placeholder(tf.float32, shape=(None, num_labels))
在会话中,我使用以下代码将新图像输入模型:
from skimage import ioimg = io.imread('newimage.png', as_grey=True)nx, ny = img.shapeimg_flat = img.reshape(nx * ny)IMG = np.reshape(img,(1,784))answer = session.run(train_prediction, feed_dict={tf_train_dataset: IMG})print(answer)
我的训练集中的图像是28*28,所以请确保你的新图像也是28*28,然后你需要将其展平为1*784,并将其输入到模型中以获得预测概率