我试图理解在图像/计算机视觉领域中,CNN架构和RCNN架构之间的基本概念差异。
如果我理解错了请纠正我,但我认为CNN提供了空间不变性(位置),而RNN提供了时间不变性(时间)。
回答:
你混淆了一些不同的概念。RNN与R-CNN并不是同一类东西。
RNN是循环神经网络,这是一种人工神经网络,其中的单元之间形成有向循环。这使得它能够表现出动态的时间行为。下图展示了一个简单的RNN单元表示。
R-CNN是基于区域的卷积神经网络。它是一种视觉对象检测系统,结合了自下而上的区域提议和由卷积神经网络计算的丰富特征。简单来说,R-CNN会在图像中提出许多框,并检查这些框中是否有任何一个实际对应于某个对象。它使用选择性搜索算法来计算这些提议区域。下图展示了R-CNN的架构:
所以,回答你的问题:R-CNN只是CNN的一个扩展,专注于对象检测,而“普通”的CNN通常用于图像分类。