神经网络：计算隐藏层中的错误

我刚开始接触神经网络，正在尝试构建一个具有多个隐藏层的最简单的网络。

在神经网络的训练阶段调整权重时，权重调整的程度部分取决于“这个神经元对下一层神经元贡献了多少错误”。因此，我们需要知道下一层的神经元错误。

当只有一个隐藏层时，计算这个错误是非常简单的，因为我们的训练数据已经提供了预期的输出，我们只需使用输出层（简单地说，目标-输出）。然而，当有多个隐藏层时，计算错误变得不那么简单。也就是说，如果我们有10个隐藏层，并且我们处于第5层，我们如何知道第6层的错误是多少？

谢谢

回答：

假设我们的神经网络输出值 $y_i$ 和实际的真实值 $t_i$ 通过损失函数相关，例如均方误差（回归情况）：

$E = \frac{1}{2} \sum_{i = 0}^{m} \left(t_i - y_i\right)^2$

其中：

$y_i &= f_{\ell}(W_{\ell}a_{\ell - 1} + b_{\ell}) \\ a_{\ell - 1} &= f_{\ell-1}(W_{\ell-1}a_{\ell - 2} + b_{\ell-1}) \\ \vdots \\ a_{1} = f_1(W_1a_0 + b_1) \\ a_{0} = x$

$W_{k}$ 和 $b_{k}$ 是第 $k$ 层的权重， $W_{k}$ 是应用于同一层所有神经元响应的激活函数。

为了从输出层传播模型权重的错误，我们只需在错误损失函数与依赖于模型参数（权重或偏置）的因子之间应用链式法则。例如，让我们找出损失函数与输出层权重之间的错误导数： $W_{k}$ 如下所示：

$\frac{\partial E}{\partial W_{\ell}} = \frac{\partial E}{\partial y} \cdot \frac{\partial y}{\partial W_{\ell}}$

$\frac{\partial E}{\partial y} = y - t$

$\frac{\partial y}{\partial W_{\ell}} = f_{\ell}'(W_{\ell}a_{\ell - 1} + b_{\ell}) a_{\ell - 1}^{T} \\$

如你所推断，我们可以应用同样的程序来计算错误导数，通过网络的每一层激活 $a_{i}$ 直到较低层。例如，让我们将错误反向传播到第 $\ell - 1$ 层：

$\frac{\partial E}{\partial W_{\ell - 1}} = \frac{\partial E}{\partial a_{\ell-1}} \cdot \frac{\partial a_{\ell-1}}{\partial W_{\ell - 1}}$

$\frac{\partial E}{\partial a_{\ell - 1}} = \frac{\partial E}{\partial a_{\ell}} \cdot \frac{\partial a_{\ell}}{\partial a_{\ell-1}}$

$\frac{\partial y}{\partial W_{\ell}} = f_{\ell}'(W_{\ell}a_{\ell - 1} + b_{\ell}) a_{\ell - 1}^{T} \\$

这个过程也可以应用于偏置，直到输入层之前的层 $a_{0}$ 。

我希望这个反向传播的总结能给你一些关于神经网络实际实现的实用见解，在这种情况下，是一个前馈神经网络。如果你想了解更多关于反向传播的详细信息，我邀请你查阅斯坦福大学的UFLDL 教程关于反向传播：

此外，如果你想了解更多关于卷积神经网络的知识，这些网络更适合计算机视觉应用，我推荐CS231n课程笔记（也有一节关于反向传播的课程），它们可以在这里找到。

学技术

神经网络：计算隐藏层中的错误

发表回复取消回复

相关文章：

Related Posts

Keras Dense层输入未被展平

无法将分类变量输入随机森林

如何在Keras中对每个输出应用Sigmoid函数？

如何选择类概率的最佳阈值？

在Keras中使用深度学习得到不同的结果

‘MatMul’操作的输入’b’类型为float32，与参数’a’的类型float64不匹配

发表回复 取消回复

发表回复取消回复