对象检测中对象占据图像很小部分

我训练了一个道路标志检测网络。在训练数据中,标志占据了整个框架,像这样:

训练图像示例

然而,在我想要用于预测的图像中,道路标志占据的空间要小得多,例如:

实际数据示例

对于这样的图像,预测效果不太好,但是如果我将图像裁剪到仅包含标志,预测结果就很好。

我该如何对更大的图像进行预测呢?

遗憾的是,我在类似的问题中找不到答案。


回答:

听起来你想要扩展对单个标志的分类,变成在更大的图像中“检测”和分类它们,这实际上是在解决一种不同类型的问题。

你有(至少)几个选择:

  • 创建一个滑动窗口,扫描整个图像并在每个步骤进行分类。这样,当窗口扫到标志时,它会返回一个好的分类。但你很快会发现这种方法既不实用也不高效。窗口大小和步进大小变成了需要优化的新参数,而且如你将在下一个选项中看到的,已经有专门针对对象检测的方法在尝试解决这一特定问题。
  • 你可以尝试使用对象检测架构。这将需要你创建一个与你在图像分类中使用的不同的训练数据集。你需要许多(数百或数千)包含(以及在某些情况下不包含)你想要识别的标志的“大”版本图像。你需要一个标注工具来定位和标记这些标志,然后你可以训练一个网络来定位和标记它们。

关于第二个选项,你可以参考的一些架构包括:YOLO,单发检测(SSD),更快的RCNN,仅举几例。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注