预测准确率

我对机器学习是新手,正在尝试学习这个过程,并从使用Weka开始进行尝试。当我在Weka中加载数据并开始分类时,软件显示了如下数值:

Correctly Classified Instances         416               39.6568 %Incorrectly Classified Instances       633               60.3432 %Kappa statistic                          0.091 Mean absolute error                      0.4371Root mean squared error                  0.4663Relative absolute error                 98.4524 %Root relative squared error             98.9763 %Coverage of cases (0.95 level)         100      %Mean rel. region size (0.95 level)     100      %Total Number of Instances             1049     === Detailed Accuracy By Class ===             TP Rate  FP Rate  Precision  Recall   F-Measure  MCC      ROC Area  PRC Area  Class             0.310    0.231    0.377      0.310    0.340      0.084    0.554     0.448     16-18             0.271    0.167    0.460      0.271    0.341      0.123    0.501     0.359     19+             0.599    0.511    0.382      0.599    0.467      0.084    0.570     0.395     All AgeWeighted Avg.    0.397    0.306    0.407      0.397    0.384      0.098    0.541     0.399     

通过查看这些数值,我可以推测我的数据质量不佳,因为正确分类的实例数是37.65,且错误率很高。但TP率和精确度似乎处于可接受的水平。

这让我感到困惑,我想知道如何根据这些数字来评判模型?这是否意味着我的数据预处理得不好?


回答:

你需要做一个混淆矩阵来获取准确率和精确度。下面是链接,希望对你有帮助。

http://www2.cs.uregina.ca/~dbd/cs831/notes/confusion_matrix/confusion_matrix.html

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注