在sklearn中有一个评估指标,称为F1分数(也存在F-beta分数)。
我知道如何使用它,但不太理解它的含义。
当F1分数大或小时,它表示什么?
如果我们不考虑公式,从F分数的值中应该理解什么?
回答:
F分数是一个简单的公式,用于综合精确率和召回率的得分。假设你想为一个二分类任务(正类或负类)预测标签。你有四种类型的预测:
- 真阳性:正确地标记为正类。
- 真阴性:正确地标记为负类。
- 假阳性:错误地标记为正类。
- 假阴性:错误地标记为负类。
精确率是所有正类预测中真阳性的比例。精确率为1意味着没有假阳性,这是好的,因为你永远不会错误地认为一个元素是正类而实际上它不是。
召回率是所有实际正类元素中真阳性的比例。召回率为1意味着没有假阴性,这是好的,因为你永远不会错误地认为一个元素属于相反的类别,而它实际上属于你的类别。
如果你想知道你的预测是否准确,你需要这两个指标。你可以有1的精确率(所以当你说它是正类时,它实际上是正类),但召回率可能非常低(你预测了3个正确的正类,但漏掉了15个其他的)。或者你可以有好的召回率但差的精确率。
这就是为什么你可能会检查F1分数,但也可以检查其他类型的F分数。如果这两个值中的一个显著下降,F分数也会下降。但请注意,在许多问题中,我们更倾向于给精确率或召回率更多的权重(在网络安全中,错误地阻止一些好的请求比放过一些坏请求要好)。