二进制对数损失是否基于y的值排除方程的一部分？

假设对数损失的方程为：

logLoss=−(1/N)*∑_{i=1}^N (yi(log(pi))+(1−yi)log(1−pi))

其中 N 是样本数量，yi...yiN 是因变量的实际值，pi...piN 是逻辑回归的预测概率

我的理解是：

如果 yi = 0，那么第一部分 yi(logpi) = 0

反之，如果 yi = 1，那么第二部分 (1−yi)log(1−pi) = 0

因此，根据 y 的值，方程的一部分会被排除。我的理解正确吗？

我的最终目标是理解如何解释对数损失的结果。

回答：

是的，你的理解方向是正确的。记住 p_i=P(y_i=1)，基本的想法是损失函数的定义方式需要惩罚那些预测与实际标签不匹配的样本（例如，当 y_i=1 但 p_i 较低时，由 yi(logpi) 部分处理，或者当 y_i=0 但 p_i 较高时，由 (1-yi)log(1-pi) 部分处理），同时，对于预测与实际标签匹配的样本，损失函数不应给予过多的惩罚（例如，当 y_i=1 且 p_i 较高，或者当 y_i=0 且 p_i 较低时）。

逻辑回归的损失函数（交叉熵）恰好满足上述损失函数的期望属性，如下图所示。

学技术

二进制对数损失是否基于y的值排除方程的一部分？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复