我正在尝试使用深度学习和滑动窗口方法来检测土豆的位置。由于卷积神经网络(CNN)不受用于训练模型的对象方向的影响,我在训练模型时没有发现任何问题,但在检测时却遇到了巨大的问题。你看,土豆或多或少有点像黄瓜。由于我使用的是滑动窗口技术,无法适应不同方向的土豆。请参考下面的图片。在分割过程的检测部分我应该怎么做?
回答:
这个神经网络是一个处理对象旋转的例子。它使用了一个数据集,其中标记了对象的位置和方向。此外,它还使用了带有旋转的数据增强。旋转角度(更准确地说,是其正弦和余弦)被添加到模型输出和损失函数中。
因此,模型可以检测对象而不受其方向的影响,并且还可以预测它们的角度。
如果你不需要预测角度,你可以在数据集中添加旋转的对象,并进行数据增强,而无需学习角度。这将使模型具有旋转不变性。