如果我没记错的话,我们通过最终预测的标签来计算分类器的精确度和召回率值。然而,sklearn
中的precision_recall_curve
使用decision_function
而不是最终的类别标签。这对最终的值有什么特殊影响吗?信心程度是否会以任何方式影响曲线?
回答:
精确度-召回率曲线是通过改变决策阈值来定义的。对于每个阈值,你会得到一个不同的硬分类器,你可以计算它的精确度和召回率,因此你可以在曲线上得到一个点。
precision_recall_curve
通过改变决策阈值,从真实标签和分类器给出的分数计算精确度-召回率曲线。
如果你将y_pred
作为类别预测传递,那么精确度-召回率曲线将变得退化,仅有三个点:(0,1)
、(1,0)
,以及对应于你的(硬)分类器的精确度和召回率的点。