Home IT技术 sklearn的roc_curve()函数返回不同维度的阈值和假阳性率

sklearn的roc_curve()函数返回不同维度的阈值和假阳性率

IT技术 xiaolong · 2025年5月31日 · 0 Comment

我认为roc_curve()函数是为每个阈值计算假阳性率和真阳性率的。但是下面的代码显示假阳性率和阈值的维度不同。

from sklearn.metrics import roc_curve
fpr,tpr,thresholds = roc_curve(y_train_5,y_scores)

fpr.shape #(3908,)
thresholds.shape #(59966,)

我还想知道为什么

precisions,recalls,thresholds = precision_recall_curve(y_train_5,y_scores)
precisions #(59967,)
thresholds #(59966,)

精确度的维度与阈值的维度相差一个？

回答：

关于roc_curve()函数，与精确度/召回率曲线不同的是，输出的长度取决于drop_intermediate选项（默认为True），该选项用于丢弃次优阈值（参考这里）。

对于第二个问题，当达到完全召回时，阈值不再输出。这可能是原因；这个链接或这个链接也可能有帮助。

audio-processing machine-learning scikit-learn

发表回复取消回复