如何处理图像中对象/字符分类的负面情况?(即如果没有检测到任何给定字符)

我正在训练一个卷积神经网络(CNN)来将图像分类为英文字母和数字。我使用7位(1/0)向量的标签形式,其中第一个1/0表示字符是否存在,后面的6位代表每个字符。例如:[1,1,0,0,1,0,0]表示字符是“a”,[1,0,1,1,0,0,0]表示字符是“O”,等等。我对如何处理未检测到任何字符的情况感到困惑。我希望我的模型输出[0,0,0,0,0,0,0]。仅用正面例子训练时,模型会自动给出这样的输出吗?还是我需要找到负面图像并将它们添加到数据集中?而且,我应该考虑哪些负面情况,因为非字符的东西几乎是无限的。我知道这个问题并不难,但我刚开始接触深度学习,所以请理解。


回答:

你应该在数据集中加入一些负面样本。这将帮助模型理解并不是每个字符或每张图像都是英文字母。关于负面样本,你应该输入非字符的图像(如汽车…)以及非英文字母的字符图像。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注