计算精确率和召回率

我对如何在使用朴素贝叶斯分类器的监督机器学习算法中计算精确率和召回率感到非常困惑

例如
1) 我有两个类别A和B
2) 我有10000份文档,其中2000份用于训练样本集(类别A=1000,类别B=1000)
3) 现在基于上述训练样本集,使用朴素贝叶斯分类器对剩余的8000份文档进行分类
4) 分类后,有5000份文档被归入类别A,3000份文档被归入类别B
5) 现在如何计算精确率和召回率?

请帮助我..

谢谢


回答:

你需要将结果分为四组 –
正确归入类别A的(TA) – 正确分类到类别A
错误归入类别A的(FA) – 错误分类到类别A
正确归入类别B的(TB) – 正确分类到类别B
错误归入类别B的(FB) – 错误分类到类别B

精确率 = TA / (TA + FA)
召回率 = TA / (TA + FB)

你可能还需要准确率和F度量:

准确率 = (TA + TB) / (TA + TB + FA + FB)
F度量 = 2 * ((精确率 * 召回率)/(精确率 + 召回率))

更多信息请见:
http://en.wikipedia.org/wiki/Precision_and_recall#Definition_.28classification_context.29

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注