这对一些人来说应该很简单,但我对Tensorflow还比较陌生,我的所有研究都让我看到了成千上万行的代码,我只是想知道是否有更简单的初学者替代方案。我有一个想法,输入一个200×260的彩色图像,输出一个1到10之间的one-hot向量。我意识到这与MNIST非常相似,但Tensorflow没有任何关于mnist库如何将其图像转换为可用形式的文档。有人有任何想法可以将大约200张图像的文件夹(是的,我知道,这很小)转换为可用形式吗?我已经有了我的one-hot向量。另外,我设置了占位符形状为tf.placeholder(tf.float32,[None, 200, 260, 3])
,这可以吗?我真的希望能保持颜色。感谢任何建议!
回答:
首先,您可以使用skimage
中的imread
导入所有图像
例如:
my_image = skimage.io.imread('./path/myimage.png')
然后,如果所有图像都符合您所需的尺寸(200×260),您可以通过将它们全部除以255来进行归一化(归一化为0到1之间的值)。如果不是,您可以使用skimage
中的resize
,这将自动为您调整大小和归一化图像。
例如
my_image = skimage.transform.resize(my_image, (200, 260))
为了可视化,您可以使用matplotlib.pyplot
中的imshow
来绘制图像。
对于Tensorflow
中内置的方便的next_batch
函数,您可以使用以下代码
i = 0def next_batch(batch_size): x = training_images[i:i + batch_size] y = training_labels[i:i + batch_size] i = (i + batch_size) % len(training_images) return x, y
然后您可以创建您的CNN并训练图像。您为X
创建的占位符看起来是正确的。