假设对数损失的方程为:
logLoss=−(1/N)*∑_{i=1}^N (yi(log(pi))+(1−yi)log(1−pi))
其中 N
是样本数量,yi...yiN
是因变量的实际值,pi...piN
是逻辑回归的预测概率
我的理解是:
如果 yi = 0
,那么第一部分 yi(logpi) = 0
反之,如果 yi = 1
,那么第二部分 (1−yi)log(1−pi) = 0
因此,根据 y
的值,方程的一部分会被排除。我的理解正确吗?
我的最终目标是理解如何解释对数损失的结果。
回答:
是的,你的理解方向是正确的。记住 p_i=P(y_i=1)
,基本的想法是损失函数的定义方式需要惩罚那些预测与实际标签不匹配的样本(例如,当 y_i=1
但 p_i
较低时,由 yi(logpi)
部分处理,或者当 y_i=0
但 p_i
较高时,由 (1-yi)log(1-pi)
部分处理),同时,对于预测与实际标签匹配的样本,损失函数不应给予过多的惩罚(例如,当 y_i=1
且 p_i
较高,或者当 y_i=0
且 p_i
较低时)。
逻辑回归的损失函数(交叉熵
)恰好满足上述损失函数的期望属性,如下图所示。