现代CNN(卷积神经网络)如DetectNet是否具有旋转不变性?

众所周知,nVidia的DetectNet – 用于对象检测的CNN(卷积神经网络)基于Yolo/DenseBox的方法: https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/

DetectNet是流行 GoogLeNet 网络的扩展。这些扩展类似于Yolo和DenseBox论文中采用的方法。

如这里所示,DetectNet可以检测任何旋转角度的对象(汽车): https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/

enter image description here

现代CNN(卷积神经网络)如DetectNet是否具有旋转不变性?

我可以用成千上万张具有相同旋转角度的图像训练DetectNet,以便检测任何旋转角度的对象吗?

enter image description here

那么,基于DetectNet的Yolo、Yolo v2、DenseBox的旋转不变性如何?


回答:

不是

在分类问题中,CNN不具有旋转不变性。你需要在训练集中包含所有可能旋转角度的图像。

你可以训练一个CNN来将图像分类到预定义的类别中(如果你想像你的例子中那样在一个图像中检测多个对象,你需要用你的分类器扫描图像的每个位置)。

然而,这是一个对象检测问题,而不仅仅是分类问题。

在对象检测问题中,你可以使用滑动窗口方法,但这极其低效。相反,除了简单的CNN之外,还有其他最先进的架构。例如:

这些架构可以检测图像中任何位置的对象,但你也必须在训练集中包含不同旋转角度的样本(并且训练集必须使用边界框进行标记,这非常耗时)。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注