我目前正在编写一个神经网络模块,我已经理解了只有一个输出的情况下所有内容的工作原理。但是当有多个输出时,我被告知要将每个输出的误差相加来计算损失函数,这对我来说毫无意义,因为这样我们就无法真正知道哪个突触/权重应对误差负责。例如,我们有一个形状为2|1|2(输入、隐藏层、输出)的神经网络…所以隐藏层的神经元通过一些权重连接到每个输出神经元。如果我们现在向前传播并为每个输出神经元接收到一个误差,并将这些误差相加,那么与隐藏层神经元相连的每个权重都会被调整相同的值。有人知道我是否理解错了或误解了什么吗?
回答:
我想你误解了,损失函数通常是为反向传播单独计算每个输出的。如果你想知道输出的总误差来跟踪你的进度,那么我想你可以使用误差的总和来做这件事。