我一直在使用Tensorflow的教程来学习神经网络。我完成了“基本分类”,这基本上就是MNIST,并一直在尝试制作自己的自定义变体作为一个小小的思想实验。除了将数据集转换为可用的形式外,一切都非常直观,因为教程使用的是预制的数据库,看起来它在某些方面有所简化。我只想知道如何将一张彩色照片转换为可用的数据。我假设这将是一个一维数组。作为一个附带问题,如果将二维照片存储在一维数组中,而这不是一个卷积神经网络(CNN),神经网络的效果会不会有所下降?
回答:
Keras中包含的数据集都是预制的,通常已经预处理过,以便初学者可以轻松尝试。对于使用你自己的图像,比如猫狗图像分类问题,你可以将图像放置在两个不同的目录中,例如,在images/cats
和images/dogs
中。现在,我们解析这些目录中的每一张图像,
import osfrom PIL import Imagemaster_dir = 'images'img_dirs = os.listdir( master_dir ) for img_dir in img_dirs: img_names = os.listdir( os.path.join( master_dir , img_dir ) ) for name in img_names: img_path = os.path.join( master_dir , img_dir , name ) image = Image.open( img_path ).resize( ( 64 , 64 ) ).convert( 'L' ) # 将此图像存储在一个数组中,并附上相应的标签
这里,image
将是一个形状为(64, 64)
的数组,这表明图像是灰度的。除了代码中的.convert( 'L' )
,我们还可以使用.convert( 'RGB' )
来获得形状为(64,64,3)
的RGB图像。
现在,
- 将所有图像和标签收集到一个Python的
list
中。 - 将列表转换为
NumPy
数组。 - 使用
np.save()
方法将NumPy
数组存储在一个.npy
文件中。 - 在训练模型的文件中,使用
np.load()
方法加载这些文件,并将它们输入到模型中。