我知道ROC曲线是由真阳性率和假阳性率计算得出的。
但是,ROC曲线上的元素是无限的,对吗?每个元素是如何计算的?有人能解释一下吗?每个点是从哪里来的?
提前感谢
回答:
这些值是根据分类器的阈值的所有可能取值计算得出的。
在x轴上,你有给定阈值下的“假阳性率”:FPR = FP / (TN + FP),其中:
- FP是假阳性数量(预测为阳性但实际为阴性的元素);
- TN是真阴性数量(预测为阴性且实际为阴性的元素);
- FP是假阳性数量(预测为阳性但实际为阴性的元素)。
在y轴上,你有给定阈值下的“真阳性率”:TPR = TP / (TP + FN),其中:
- TP是真阳性数量(预测为阳性且实际为阳性的元素);
- FN是假阴性数量(预测为阴性但实际为阳性的元素)。
实际上,你并没有无限的点数:你受限于数据集的点数(在某些阈值范围内,率不会发生变化)。