在特征金字塔网络(论文)中,任何CNN(例如ResNet-101)的最后一层被提取并上采样2、4和6倍,分别用于P5、P4和P3。为了生成更细粒度的特征图,从ResNet-101的前几层引入横向连接并进行拼接。
在RetinaNet(论文)中,有额外的两个金字塔层,P6层通过在ResNet-101的最后一个卷积层上应用3×3滤波器构造而成,P7层则通过在P6层上应用3×3滤波器构造而成,两者的步长均为2。
所有特征金字塔层都会通过一个分类子网络和一个边界框子网络进行处理,这两个子网络在所有特征金字塔层之间共享权重。
由于P6和P7具有更大的感受野,分类子网络是采用最大的感受野,还是每个金字塔层的感受野分别处理?
回答:
我认为是分别处理的。特征金字塔的整个设计理念就是利用各个尺度的特征。