我想知道XGBClassifier对每次预测的信心程度。有没有这样一个值?或者predict_proba
已经间接地表示了模型的信心?
回答:
你的直觉确实是正确的:predict_proba
返回每个样本属于某个类别的概率;从文档中可以看到:
predict_proba
(data, output_margin=False, ntree_limit=0)预测每个data样本属于某个类别的概率。
这种概率在实践中通常被解释为预测的信心。
不过,这是一种临时性的、实用的解释,与p值或任何其他统计严谨性措施无关;据我所知,一般来说,对于这种(以及类似的)机器学习技术,没有这样的措施可用。
在更广泛的层面上,你可能有兴趣了解,p值本身在统计学家中正在迅速失宠;一些快速链接:
-
美国统计协会关于p值的声明:背景、过程和目的(美国统计学家)
-
统计学家对p值误用的警告(自然)
-
p值的问题不仅仅是p值本身(Andrew Gelman @ 美国统计学家)
-
p值的问题(朝向数据科学博客文章)