在cnn_mnist.py示例中,脚本首先从第120
行到第124
行加载训练和测试数据。正如我在print(train_data.shape)
中看到的,输出是(55000, 784)
。因此,我理解这里的训练集包含55000
张图像,每张图像的维度为784
。我的问题是:这个维度是如何生成的?是不是通过将MNIST数据集中的每张图像转换为1D向量?我想了解这一点,因为我想用我自己收集的手写图像来运行这个脚本。
谢谢
回答:
你可以简单地理解为,MNIST数据集中的每张图像都是28×28像素,所以当我们将图像转换为1D矩阵时,其大小变为28×28=784。
MNIST图像大小为28 × 28像素,因此它被表示为784的1维数组。
矩阵中的每个值代表0到255之间的数值。