我在阅读一篇不错的论文S-DCNet时,发现了一个部分(页面3,表1,分类器),其中在特征图上使用了一个卷积层,以产生一个二分类输出,作为内部过程的一部分。由于我是个新手,每当有人和我谈论分类时,我会自动联想到全连接层(FCs)与softmax的结合,所以我开始思考……这是可能的吗?卷积层真的可以用于二元分类的分类吗?这个概念如此激发我的想象力,以至于我坚持要得到答案……
说实话,这到底是如何工作的?使用卷积滤波器代替全连接层进行分类有什么区别?
编辑(关于它是如何工作的不确定答案):我问了一位同事,他告诉我,使用与当前阶段特征图长度-宽度形状相同的滤波器,可能会导致可学习的二元输出(考虑到你还将特征图的通道数减少到单一通道)。但我仍然不理解这种技术背后的动机……
回答:
使用卷积作为全连接层是可以做到的(例如)使用空间尺寸为(1,1)的滤波器,并且深度与全连接层的输入尺寸相同。
生成的特征图将与输入特征图的大小相同,但每个像素将是一个“全连接”层的输出,其权重是共享的1×1卷积滤波器的权重。
这种方法主要用于语义分割,意味着每个像素的分类。如果我没记错的话,U-net就是一个很好的例子。
另见这个。
另请注意,1×1卷积还有其他用途。
paperswithcode上的一些网络可能使用了这种技巧。