Home IT技术为什么我们使用概率来计算精确度-召回率曲线而不是实际类别？

为什么我们使用概率来计算精确度-召回率曲线而不是实际类别？

IT技术 xiaolong · 2025年5月28日 · 0 Comment

如果我没记错的话，我们通过最终预测的标签来计算分类器的精确度和召回率值。然而，sklearn中的precision_recall_curve使用decision_function而不是最终的类别标签。这对最终的值有什么特殊影响吗？信心程度是否会以任何方式影响曲线？

回答：

精确度-召回率曲线是通过改变决策阈值来定义的。对于每个阈值，你会得到一个不同的硬分类器，你可以计算它的精确度和召回率，因此你可以在曲线上得到一个点。

precision_recall_curve通过改变决策阈值，从真实标签和分类器给出的分数计算精确度-召回率曲线。

精确度、召回率和 F 度量 | Scikit-learn

如果你将y_pred作为类别预测传递，那么精确度-召回率曲线将变得退化，仅有三个点：(0,1)、(1,0)，以及对应于你的（硬）分类器的精确度和召回率的点。

machine-learning precision-recall scikit-learn

发表回复取消回复