我是Tensorflow的新手,我不明白为什么输入占位符经常被设定为训练时使用的批次大小。
我在这篇文章中发现的例子以及官方Mnist教程中并没有这样做
from get_mnist_data_tf import read_data_setsmnist = read_data_sets("MNIST_data/", one_hot=True)import tensorflow as tfsess = tf.InteractiveSession()x = tf.placeholder("float", shape=[None, 784])y_ = tf.placeholder("float", shape=[None, 10])W = tf.Variable(tf.zeros([784,10]))b = tf.Variable(tf.zeros([10]))sess.run(tf.initialize_all_variables())y = tf.nn.softmax(tf.matmul(x,W) + b)cross_entropy = -tf.reduce_sum(y_*tf.log(y))train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)for i in range(1000): batch = mnist.train.next_batch(50) train_step.run(feed_dict={x: batch[0], y_: batch[1]})correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))print(accuracy.eval(feed_dict={x: mnist.test.images, y_: mnist.test.labels}))
那么,如何正确地设定和创建模型输入并进行训练呢?
回答:
在这里你正在指定模型的输入。你希望将批次大小设置为None
,这意味着你可以用不同数量的输入(一个或多个)来运行模型。批处理对于有效利用计算资源非常重要。
x = tf.placeholder("float", shape=[None, 784])y_ = tf.placeholder("float", shape=[None, 10])
接下来重要的一行是:
batch = mnist.train.next_batch(50)
在这里你发送50个元素作为输入,但你也可以将其改为只发送一个
batch = mnist.train.next_batch(1)
而无需修改图。如果你指定了批次大小(在第一个代码片段中用某个数字代替None),那么每次都要进行更改,这在生产环境中尤其不理想。