如何在使用xgboost进行分类时获得置信区间或预测分散度测量?
例如,如果xgboost预测某事件的概率为0.9,该如何获得对该概率的信心水平?
此外,这种信心是否被假定为异方差的?
回答:
要为xgboost模型生成置信区间,您应该训练多个模型(可以使用装袋方法)。每个模型都会对测试样本产生响应——所有响应将形成一个分布,您可以使用基本统计方法从中轻松计算置信区间。您应该为每个测试样本生成响应分布。
如何在使用xgboost进行分类时获得置信区间或预测分散度测量?
例如,如果xgboost预测某事件的概率为0.9,该如何获得对该概率的信心水平?
此外,这种信心是否被假定为异方差的?
回答:
要为xgboost模型生成置信区间,您应该训练多个模型(可以使用装袋方法)。每个模型都会对测试样本产生响应——所有响应将形成一个分布,您可以使用基本统计方法从中轻松计算置信区间。您应该为每个测试样本生成响应分布。