我有一个三类分类问题。
我的预测标签包含所有三个类别。
然而,我的目标标签中只有其中的两个类别。
例如:
predicted = [1,1,2,3,2,1]target = [1,1,2,2,2,1]
在这种情况下,我应该如何计算F1分数?
我目前使用sklearn
的f1_score
函数,并采用macro
平均法。
但这导致在上述情况下的F1分数值较低。
回答:
f1_score
提供了一个名为labels
的参数,允许你在average != 'binary'
的情况下定义一组要包含的标签。
例如,如果你只对分类器在类别1
和2
上的表现感兴趣,你可以这样做:
from sklearn.metrics import f1_scorepredicted = [1, 1, 2, 3, 2, 1]target = [1, 1, 2, 2, 2, 1]print(f1_score(target, predicted, average='macro', labels=[1, 2]))# 0.9