我最近完成了Ng教授在Coursera上的机器学习课程,但在理解反向传播算法方面遇到了一些问题。因此,我尝试阅读Bishop关于使用Sigmoid函数的反向传播的代码。我搜索并找到了试图解释反向传播作用的清晰代码,但仍然在理解代码上存在问题
有谁能解释一下反向传播到底做了什么?并且帮我解释一下代码吗?
这里是我之前提到的在GitHub上找到的代码
回答:
网络存在错误。反向传播的第一步是计算网络中每个神经元的部分责任。你的目标是将错误描述为对权重(你可以更改的参数)的依赖性。因此,反向传播方程是错误对权重的部分导数。
第一步:错误信号 = (期望结果 – 输出神经元的输出) x 激活函数的导数(x),其中x是输出神经元的输入。这是输出神经元的部分责任。
下一步是计算隐藏单元的部分责任。这一步的第一部分是下一层错误信号的总和 x 连接隐藏单元与下一层单元的权重。其余部分是激活函数的部分导数。错误信号 = sum(下一层错误 x 权重) x 激活函数的导数(x)。
最后一步是调整权重。
wij = 错误信号_i x 学习率 x 神经元_j的输出
我在Matlab中实现的BP神经网络