在Weka中解释分类结果

我在Weka中运行分类算法,但对于Weka生成的用于报告目的的一些结果不太确定。

在分类问题中(例如“是”=有疾病或“否”=没有疾病),Weka为每个分类器生成结果。同时在底部为两个分类器提供加权结果。

图片

我的问题是从报告的角度来看,我应该报告哪个分数?(基本上我想将我的结果与其他人的结果进行比较)

根据Weka的结果(附件)关于F-Measure;它是91%还是89%?同样的问题也适用于所有其他测量(召回率和精确度)。

另外,我想知道在研究论文中,对于任何给定的分类器,报告的是什么分数?是加权的还是我们试图预测的分类器的分数,例如在我的情况下,只报告“是”的结果分数?

非常感谢,


回答:

用例定义了你报告的内容。一般来说,研究论文会报告整个混淆矩阵和统计表。这允许读者提取他们使用研究方式所需的数据。

如果一个患者从这个分类器中得到“无病”的结果,实际上有大约18%的可能性这个人确实有病。这是可以接受的吗?这不是SO(Stack Overflow)能回答的问题:这是用例的问题。

如果你坚持用一个单一的标量统计数据来描述测试,你需要明确用例,并准确报告那个单一指标。一般来说,报告的是总结的F-Measure(加权的)。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注