我在Weka中运行分类算法,但对于Weka生成的用于报告目的的一些结果不太确定。
在分类问题中(例如“是”=有疾病或“否”=没有疾病),Weka为每个分类器生成结果。同时在底部为两个分类器提供加权结果。
我的问题是从报告的角度来看,我应该报告哪个分数?(基本上我想将我的结果与其他人的结果进行比较)
根据Weka的结果(附件)关于F-Measure;它是91%还是89%?同样的问题也适用于所有其他测量(召回率和精确度)。
另外,我想知道在研究论文中,对于任何给定的分类器,报告的是什么分数?是加权的还是我们试图预测的分类器的分数,例如在我的情况下,只报告“是”的结果分数?
非常感谢,
回答:
用例定义了你报告的内容。一般来说,研究论文会报告整个混淆矩阵和统计表。这允许读者提取他们使用研究方式所需的数据。
如果一个患者从这个分类器中得到“无病”的结果,实际上有大约18%的可能性这个人确实有病。这是可以接受的吗?这不是SO(Stack Overflow)能回答的问题:这是用例的问题。
如果你坚持用一个单一的标量统计数据来描述测试,你需要明确用例,并准确报告那个单一指标。一般来说,报告的是总结的F-Measure(加权的)。