可以使用卷积滤波器代替全连接层进行分类吗?

我在阅读一篇不错的论文S-DCNet时,发现了一个部分(页面3,表1,分类器),其中在特征图上使用了一个卷积层,以产生一个二分类输出,作为内部过程的一部分。由于我是个新手,每当有人和我谈论分类时,我会自动联想到全连接层(FCs)与softmax的结合,所以我开始思考……这是可能的吗?卷积层真的可以用于二元分类的分类吗?这个概念如此激发我的想象力,以至于我坚持要得到答案……

说实话,这到底是如何工作的?使用卷积滤波器代替全连接层进行分类有什么区别?

编辑(关于它是如何工作的不确定答案):我问了一位同事,他告诉我,使用与当前阶段特征图长度-宽度形状相同的滤波器,可能会导致可学习的二元输出(考虑到你还将特征图的通道数减少到单一通道)。但我仍然不理解这种技术背后的动机……


回答:

使用卷积作为全连接层是可以做到的(例如)使用空间尺寸为(1,1)的滤波器,并且深度与全连接层的输入尺寸相同。

生成的特征图将与输入特征图的大小相同,但每个像素将是一个“全连接”层的输出,其权重是共享的1×1卷积滤波器的权重。

这种方法主要用于语义分割,意味着每个像素的分类。如果我没记错的话,U-net就是一个很好的例子。


另见这个
另请注意,1×1卷积还有其他用途
paperswithcode上的一些网络可能使用了这种技巧。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注