使用高斯朴素贝叶斯进行多类分类，准确率、精确率和F1分数的输出相同

我是Python和分类算法的新手。我正在使用GaussianNB对NSL KDD数据集进行多类分类，最终需要获得精确率、召回率和F1分数的值。

from sklearn.metrics import accuracy_scorefrom sklearn.metrics import precision_scorefrom sklearn.metrics import recall_scorefrom sklearn.metrics import f1_scorefrom sklearn.metrics import confusion_matrix, zero_one_lossfrom sklearn.metrics import classification_reportfrom sklearn.naive_bayes import GaussianNBgnb = GaussianNB()y_pred = gnb.fit(train_x, train_Y).predict(test_x)results_nm = confusion_matrix(test_Y,y_pred)#print(results_nm)print(classification_report(test_Y,y_pred))print(accuracy_score(test_Y,y_pred))print("Precision Score : ",precision_score(test_Y,y_pred,                                            pos_label='positive',                                           average='micro'))print("Recall Score : ",recall_score(test_Y,y_pred,                                            pos_label='positive',                                           average='micro'))print(f1_score(test_Y,y_pred,average='micro'))

我参考了类似问题中的说明，链接为sklearn metrics for multiclass classification。

输出如下，但我得到的三个指标的输出值都是相同的。 这可能是什么原因？

回答：

这种情况是可能发生的，正如你在混淆矩阵中看到的，你的三个指标的微平均值实际上是相同的。

在微平均方法中，你会将系统对不同数据集的真实正例、误报正例和误报负例进行累加，并应用这些数据来计算统计数据。例如，对于一组数据，系统的

真实正例 (TP1)  = 12误报正例 (FP1) = 5误报负例 (FN1) = 10

那么精确率 (P1) 和召回率 (R1) 将分别是 (12/(12+5)) 和 (12/(12+10))

如果FP1 == FN1，那么它们将是相同的。

对于另一组数据，系统的

真实正例 (TP2)  = 50误报正例 (FP2) = 7误报负例 (FN2) = 7

那么精确率 (P2) 和召回率 (R2) 将是相同的。

现在，使用微平均方法，系统的平均精确率和召回率是

微平均F分数将简单地是这两个数值的调和平均数。

因此，对于特定的FP和FN值，这些指标可能相同。从方程中我们可以说，如果FP1 + FP2 == FN1 + FN2，那么微平均的精确率和召回率将是相同的。

你可以尝试调整方程中的数值，使所有三个指标给出相同的值，因此你可以尝试使用宏平均或加权平均方法。

学技术

使用高斯朴素贝叶斯进行多类分类，准确率、精确率和F1分数的输出相同

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复