batch_loss和total_loss=tf.get_total_loss() 在TensorFlow中

我在阅读im2txt源代码时遇到了一个问题。

其中有batch_loss和total_loss：batch_loss是对每个批次数据计算的损失，并通过tf.add_loss(batch_loss)调用添加到tf.Graphkeys.LOSSES中。total_loss则是通过tf.losses.get_total_loss()获取的，它会对tf.Graphkeys.LOSSES中的所有损失进行平均计算。

问题：为什么参数是通过total_loss来更新的？这个问题困扰了我好几天。

回答：

评论中讨论的总结：

训练损失是在对小批量数据的前向传递中计算的。但实际上开始反向传播并不需要这些损失值。反向传播是通过误差信号启动的，该信号等于在前向传递的值上计算的损失函数的导数。因此，损失值不会影响参数的更新，报告损失值只是为了监控训练过程。例如，如果损失值没有下降，这是一个重新检查神经网络模型和超参数的信号。因此，通过平均来平滑报告的损失值以使图表看起来更美观并不是什么大问题。

欲了解更多详情，请查看这篇文章。

学技术

batch_loss和total_loss=tf.get_total_loss() 在TensorFlow中

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复