如何从特定目录或文件夹导入预下载的MNIST数据集?

我已经从LeCun网站下载了MNIST数据集。我希望编写Python代码来解压gzip文件并直接从目录中读取数据集,这意味着我不再需要下载或访问MNIST网站。

期望的流程:访问文件夹/目录 –> 解压gzip –> 读取数据集(独热编码)

该如何操作呢?因为几乎所有教程都需要访问LeCun或TensorFlow网站来下载和读取数据集。提前感谢!


回答:

这个TensorFlow调用

from tensorflow.examples.tutorials.mnist import input_datainput_data.read_data_sets('my/directory')

… 如果你已经在该目录下有了文件,它不会下载任何东西

但如果出于某些原因你希望自己解压,这里是如何做的:

from tensorflow.contrib.learn.python.learn.datasets.mnist import extract_images, extract_labelswith open('my/directory/train-images-idx3-ubyte.gz', 'rb') as f:  train_images = extract_images(f)with open('my/directory/train-labels-idx1-ubyte.gz', 'rb') as f:  train_labels = extract_labels(f)with open('my/directory/t10k-images-idx3-ubyte.gz', 'rb') as f:  test_images = extract_images(f)with open('my/directory/t10k-labels-idx1-ubyte.gz', 'rb') as f:  test_labels = extract_labels(f)

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注