我最近研究了一些用于对象检测的不同卷积神经网络,发现我关注的大多数模型都是全卷积网络,比如最新的YOLO版本和retinanet。
除了全卷积网络(FCNs)具有较少的不同层数之外,与传统的带池化的卷积神经网络(CNNs)相比,FCNs还有哪些优势?我阅读了https://arxiv.org/pdf/1412.6806.pdf,根据我的理解,该论文的主要兴趣在于简化网络结构。这是现代检测/分类网络不使用池化的唯一原因吗,还是有其他好处?
回答:
使用FCNs,我们避免了使用密集层,这意味着参数更少,因此可以使网络学习得更快。
如果避免使用池化,你的输出将与输入具有相同的高度/宽度。但我们的目标是减小卷积的尺寸,因为这样计算效率更高。此外,使用池化我们可以构建更深的网络,因为随着层数的增加,单个神经元可以“看到”更多的输入。另外,它有助于在不同尺度上传播信息。
通常,这些网络包括一个下采样路径来提取所有必要的特征,以及一个上采样路径将高层次特征重新构建回原始图像尺寸。
有一些架构,如Springenberg的“全卷积网络”,在某种程度上避免了池化,以追求速度和简洁性。在这篇论文中,作者用步长为2的卷积替代了所有的池化操作,并在输出层使用了全局平均池化。全局平均池化操作可以减少给定输入的维度。