我有一个三类分类问题。我训练了分类器,然后绘制了不同类别的ROC曲线。
我需要为每个类别找到一个阈值,该阈值可以最大化TPR并最小化FPR。在Matlab中可以得到这个值。在Python/sklearn中是否有办法获取这个阈值?
谢谢。
回答:
所以我的想法是这样的:
import numpy as npidx = np.linalg.norm( (np.array([[0, 1]]) -np.stack([fpr, tpr], axis=1)), axis=1).argmax()max_thresh = thresholds[idx]
这里所做的是:将FPR和TPR堆叠成一个二维向量。从每个行的向量中减去左上角,然后计算范数。这计算了距离。使用argmax找出最大值出现在哪一行。最后,返回该索引处的阈值。