如何从特定目录或文件夹导入预下载的MNIST数据集?

我已经从LeCun网站下载了MNIST数据集。我希望编写Python代码来解压gzip文件并直接从目录中读取数据集,这意味着我不再需要下载或访问MNIST网站。

期望的流程:访问文件夹/目录 –> 解压gzip –> 读取数据集(独热编码)

该如何操作呢?因为几乎所有教程都需要访问LeCun或TensorFlow网站来下载和读取数据集。提前感谢!


回答:

这个TensorFlow调用

from tensorflow.examples.tutorials.mnist import input_datainput_data.read_data_sets('my/directory')

… 如果你已经在该目录下有了文件,它不会下载任何东西

但如果出于某些原因你希望自己解压,这里是如何做的:

from tensorflow.contrib.learn.python.learn.datasets.mnist import extract_images, extract_labelswith open('my/directory/train-images-idx3-ubyte.gz', 'rb') as f:  train_images = extract_images(f)with open('my/directory/train-labels-idx1-ubyte.gz', 'rb') as f:  train_labels = extract_labels(f)with open('my/directory/t10k-images-idx3-ubyte.gz', 'rb') as f:  test_images = extract_images(f)with open('my/directory/t10k-labels-idx1-ubyte.gz', 'rb') as f:  test_labels = extract_labels(f)

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注