现代CNN(卷积神经网络)如DetectNet是否具有旋转不变性?

众所周知,nVidia的DetectNet – 用于对象检测的CNN(卷积神经网络)基于Yolo/DenseBox的方法: https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/

DetectNet是流行 GoogLeNet 网络的扩展。这些扩展类似于Yolo和DenseBox论文中采用的方法。

如这里所示,DetectNet可以检测任何旋转角度的对象(汽车): https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/

enter image description here

现代CNN(卷积神经网络)如DetectNet是否具有旋转不变性?

我可以用成千上万张具有相同旋转角度的图像训练DetectNet,以便检测任何旋转角度的对象吗?

enter image description here

那么,基于DetectNet的Yolo、Yolo v2、DenseBox的旋转不变性如何?


回答:

不是

在分类问题中,CNN不具有旋转不变性。你需要在训练集中包含所有可能旋转角度的图像。

你可以训练一个CNN来将图像分类到预定义的类别中(如果你想像你的例子中那样在一个图像中检测多个对象,你需要用你的分类器扫描图像的每个位置)。

然而,这是一个对象检测问题,而不仅仅是分类问题。

在对象检测问题中,你可以使用滑动窗口方法,但这极其低效。相反,除了简单的CNN之外,还有其他最先进的架构。例如:

这些架构可以检测图像中任何位置的对象,但你也必须在训练集中包含不同旋转角度的样本(并且训练集必须使用边界框进行标记,这非常耗时)。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注