我对如何在使用朴素贝叶斯分类器的监督机器学习算法中计算精确率和召回率感到非常困惑
例如
1) 我有两个类别A和B
2) 我有10000份文档,其中2000份用于训练样本集(类别A=1000,类别B=1000)
3) 现在基于上述训练样本集,使用朴素贝叶斯分类器对剩余的8000份文档进行分类
4) 分类后,有5000份文档被归入类别A,3000份文档被归入类别B
5) 现在如何计算精确率和召回率?
请帮助我..
谢谢
回答:
你需要将结果分为四组 –
正确归入类别A的(TA) – 正确分类到类别A
错误归入类别A的(FA) – 错误分类到类别A
正确归入类别B的(TB) – 正确分类到类别B
错误归入类别B的(FB) – 错误分类到类别B
精确率 = TA / (TA + FA)
召回率 = TA / (TA + FB)
你可能还需要准确率和F度量:
准确率 = (TA + TB) / (TA + TB + FA + FB)
F度量 = 2 * ((精确率 * 召回率)/(精确率 + 召回率))
更多信息请见:
http://en.wikipedia.org/wiki/Precision_and_recall#Definition_.28classification_context.29