我想知道以下两者之间的区别:
from sklearn import datasetsdataset = datasets.fetch_mldata("MNIST Original")
和
from sklearn.datasets import load_digitstempdigits = load_digits()
它们与MNIST数据集有何关联?
回答:
sklearn自带了一些小的标准数据集,这些数据集不需要从外部网站下载任何文件。load_digits包含了来自UCI ML数据集的大约1800个8×8大小的样本:
http://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits
fetch_mldata会从http://mldata.org/repository/data/viewslug/mnist-original/下载MNIST数据集,该数据集包含70000个28×28像素大小的样本
因此,基本上下载的数据集是不同的。