以下代码用于生成随机森林二分类概率输出。
library(randomForest) rf <- randomForest(train, train_label,importance=TRUE,proximity=TRUE)prediction<-predict(rf, test, type="prob")
然后,预测结果如下所示:
测试数据的真实标签已知(命名为test_label)。现在我想计算二分类概率输出的对数损失。对数损失的函数如下所示。
LogLoss=function(actual, predicted){ result=-1/length(actual)*(sum((actual*log(predicted)+(1-actual)*log(1-predicted)))) return(result)}
如何使用二分类概率输出计算对数损失。谢谢您。
回答:
library(randomForest) rf <- randomForest(Species~., data = iris, importance=TRUE, proximity=TRUE)prediction <- predict(rf, iris, type="prob")#限制结果,否则可能会得到无穷大结果prediction <- apply(prediction, c(1,2), function(x) min(max(x, 1E-15), 1-1E-15)) #model.matrix生成一个真实概率矩阵,其中元素要么是1要么是0#我们减去预测值,如果结果大于0,则该类别是正确的logLoss = function(pred, actual){ -1*mean(log(pred[model.matrix(~ actual + 0) - pred > 0]))}logLoss(prediction, iris$Species)