Tensorflow estimator: average_loss与loss的区别

在tf.estimator中，average_loss和loss有什么区别？我原本猜测前者应该是后者除以记录数，但事实并非如此；在几千条记录的情况下，后者大约是前者的三到四倍。

回答：

average_loss和loss的区别在于，一个是对批次损失进行SUM（求和）操作，另一个是对相同的损失进行MEAN（求平均）操作。因此，它们之间的比率正好是你的input_fn中的batch_size参数。如果你传入batch_size=1，你会发现它们相等。

实际报告的张量取决于特定类型的tf.Estimator，但它们非常相似，这是回归头部的源代码（对应于tf.DNNRegressor）：

training_loss = losses.compute_weighted_loss(unweighted_loss, weights=weights,                                             reduction=losses.Reduction.SUM)mean_loss = metrics_lib.mean(unweighted_loss, weights=weights)

如你所见，它们是从相同的unweighted_loss和weights张量计算得出的。相同的值会被报告到tensorboard摘要中。

学技术

Tensorflow estimator: average_loss与loss的区别

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复