无法理解scikit-learn中precision_recall_fscore_support返回值的类别排序

经过多次尝试，我无法理解如何从precision_recall_fscore_support的返回值中恢复类别的指标。

例如，在这个经典的学习环境中：

target_names = set(y)y = [target_names.index(x) for x in y]X_train, X_test, y_train, y_test = train_test_split(X, y)# 进行某些分类...y_pred = clf.predict(X_test)precision, recall, f1, support = precision_recall_fscore_support(y_test, y_pred)

这里，len(set(y_test)) == len(support)，所以我认为y_test中所有的类别都包含在返回值中。但我找不到它们是如何排序的，所以我无法确定哪些指标对应哪个类别。

感谢您的帮助！

回答：

标签是按排序顺序排列的。引用文档如下：

默认情况下，y_true 和 y_pred 中的所有标签按排序顺序使用

类别的顺序由precision_recall_fscore_support中的labels参数决定。如果没有提供，则默认行为是收集y_pred和y_true中的所有类别，并按排序顺序排列。

文档示例：

y_true = np.array(['cat', 'pig', 'dog', 'cat', 'dog', 'pig'])y_pred = np.array(['cat', 'dog', 'pig', 'cat', 'cat', 'dog'])precision_recall_fscore_support(y_true, y_pred)

输出：

(array([ 0.66666667,  0.        ,  0.        ]), array([ 1.,  0.,  0.]), array([ 0.8,  0. ,  0. ]), array([2, 2, 2]))

上述元组包含4个数组（精确度、召回率、F分数和支持度），每个数组有3个元素，分别对应’cat’、’dog’和’pig’。（您可以自己计算这些指标是按照排序后的类别’cat’、’dog’、’pig’排列的）。

即使您在这里更改标签的顺序：

y_true = np.array(['cat', 'dog', 'pig', 'cat', 'dog', 'pig'])y_pred = np.array(['cat', 'pig', 'dog', 'cat', 'cat', 'dog'])

输出仍然相同：

(array([ 0.66666667,  0.        ,  0.        ]), array([ 1.,  0.,  0.]), array([ 0.8,  0. ,  0. ]), array([2, 2, 2]))

如果y包含数值，也会发生同样情况。

希望这能解答您的疑惑。如有任何疑问，请随时提问。

学技术

无法理解scikit-learn中precision_recall_fscore_support返回值的类别排序

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复