多类数据在Python中的真正率和假正率(TPR, FPR)[duplicate]

如何计算多类分类问题中的真正率和假正率?例如,

y_true = [1, -1,  0,  0,  1, -1,  1,  0, -1,  0,  1, -1,  1,  0,  0, -1,  0]y_prediction = [-1, -1,  1,  0,  0,  0,  0, -1,  1, -1,  1,  1,  0,  0,  1,  1, -1]

混淆矩阵是通过metrics.confusion_matrix(y_true, y_prediction)计算的,但这只是将问题转移了。


在@的人回答后编辑。这里,类-1被视为负类,而01被视为正类的不同变体。


回答:

使用你的数据,你可以一次性获取所有类别的所有指标:

import numpy as npfrom sklearn.metrics import confusion_matrixy_true = [1, -1,  0,  0,  1, -1,  1,  0, -1,  0,  1, -1,  1,  0,  0, -1,  0]y_prediction = [-1, -1,  1,  0,  0,  0,  0, -1,  1, -1,  1,  1,  0,  0,  1,  1, -1]cnf_matrix = confusion_matrix(y_true, y_prediction)print(cnf_matrix)#[[1 1 3]# [3 2 2]# [1 3 1]]FP = cnf_matrix.sum(axis=0) - np.diag(cnf_matrix)  FN = cnf_matrix.sum(axis=1) - np.diag(cnf_matrix)TP = np.diag(cnf_matrix)TN = cnf_matrix.sum() - (FP + FN + TP)FP = FP.astype(float)FN = FN.astype(float)TP = TP.astype(float)TN = TN.astype(float)# 敏感度、命中率、召回率或真正率TPR = TP/(TP+FN)# 特异度或真负率TNR = TN/(TN+FP) # 精确度或阳性预测值PPV = TP/(TP+FP)# 阴性预测值NPV = TN/(TN+FN)# 误报率或假正率FPR = FP/(FP+TN)# 假负率FNR = FN/(TP+FN)# 假发现率FDR = FP/(TP+FP)# 总体准确率ACC = (TP+TN)/(TP+FP+FN+TN)

对于有很多类的一般情况,这些指标在下图中以图形方式表示:

多类混淆矩阵

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注