在使用MNIST数据集训练的CNN进行数字识别时的表现不佳

我使用tensorflow训练了一个CNN模型来进行MNIST数据集的数字识别。测试集上的准确率接近98%

我想要使用自己创建的数据来预测数字,结果却很差。

我对自己写的图像做了什么?

我分割出每个数字,并将其转换为灰度,然后调整图像大小至28x28,最后输入到模型中。

为什么我的数据集上的准确率这么低,而测试集上的准确率却这么高呢?

我还需要对图像进行其他修改吗?

编辑:

这是图像的链接以及一些示例:

数字7的图像数字5数字9数字6


回答:

排除错误和明显的失误,我的猜测是您捕捉手写数字的方式与训练集差异太大。

在捕捉数据时,您应该尽可能模仿创建MNIST数据集的过程:

来自官方MNIST数据集网站的说明:

来自NIST的原始黑白(双色)图像被大小归一化为适合20×20像素的框,同时保持其纵横比。归一化算法使用的抗锯齿技术使得结果图像包含灰度级。图像通过计算像素的质心并将图像平移,使该点位于28×28图像的中心来居中处理。

如果您的数据在训练和测试阶段有不同的处理方式,那么您的模型将无法从训练数据泛化到测试数据。

因此,我有两个建议给您:

  1. 尝试捕捉和处理您的数字图像,使其尽可能与MNIST数据集相似;
  2. 将您的一些示例添加到训练数据中,让您的模型能够在与您分类相似的图像上进行训练;

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注