我在阅读一些论文和教程时发现,到处都提到“要进行任何分类或回归,我们需要全连接层作为输出层”。为什么会这样?背后的直觉是什么?我无法与自己的理解联系起来。如果我在最后一层使用 dropout 会怎么样?
回答:
首先,dropout 是一种调整由首因效应导致的错误训练的方法:丢弃一些中间结论,并相信有效的结论会自然重新出现。dropout 通常不用于最后一层。
全连接的最后一层是神经网络中用于分类的常见做法:它为倒数第二层(即紧邻前的层)中的每个感知器提供一个权重,以影响最终的分类结果。
总的想法是,倒数第二层包含模型用于做出分类决策的最高层次的抽象和关系。这些抽象和关系中的每一个都为每种可能的分类获得一个“声音”(即权重)。结果就是在末端有一个全连接(FC)层。