我对这个主题还比较新手,已经做了很多阅读。我特别困惑的是卷积神经网络如何在训练数据集中为特定标记的特征学习其滤波器。
成本是通过哪些输出应该或不应该在像素级别上激活来计算的吗?如果是这种情况,在进行下采样后,如何将激活映射到标记数据?
我为任何错误的假设或一般的误解道歉。再说一次,我对这个领域是新手,欢迎所有反馈。
回答:
我将把这个问题分成几个小部分来说明。
-
成本计算 —— 成本/错误/损失仅依赖于将最终预测(最后一层的输出)与标签(真实值)进行比较。这作为衡量预测正确或错误的指标。
-
层间结构 —— 每个预测的输入都是前一层的输出。这个输出有一个值;两个之间的链接有一个权重。
-
反向传播 —— 每个权重根据错误比较和其自身权重成比例地进行调整。一个导致正确预测的连接会得到奖励:其权重在数值上增加。相反,一个推动错误预测的连接会减少。
-
像素级控制 —— 为了澄清术语……传统上,每个核都是一个由浮点值组成的方形矩阵,每个值称为“像素”。这些像素是单独训练的。然而,这种训练来自于在核上滑动一个较小的滤波器(也是方形的),并将窗口与核的相应方形子矩阵进行点积运算。该点积的输出是下一层中单个像素的值。
-
当第
N
层的像素强度增加时,这实际上增加了提供该输入的第N-1
层滤波器的影响力。该滤波器的像素反过来由第N-2
层的输入进行调整。