解释混淆矩阵

我需要创建一个分类模型来预测某事件的类别 – 1、2或3。我已经尝试了两种模型:多类决策树和多类神经网络。以下是每个模型的准确率得分和混淆矩阵。

多类决策树:

总体准确率 0.634平均准确率 0.756微平均精确度 0.634宏平均精确度 0.585184微平均召回率 0.634宏平均召回率 0.548334

混淆矩阵:

  1. 40.3% 53.6% 6.1%
  2. 6.6% 76.6% 16.8%
  3. 0.6% 51.8% 47.6%

多类神经网络:总体准确率 0.5865平均准确率 0.724333微平均精确度 0.5865宏平均精确度 0.583795微平均召回率 0.5865宏平均召回率 0.460215

混淆矩阵:

  1. 34.8% 63.5% 1.7%

  2. 2.9% 89.3% 7.7%

  3. 0.1% 85.9% 13.9%

    我认为这意味着在Class2上,这两个模型表现良好,尤其是神经网络模型。在其他类别上,决策树模型表现得更好,但仍然低于50%。

根据这些指标,我应该如何改进结果?谢谢。


回答:

删除id特征,同时检查并删除你认为对预测无价值的任何特征(如id等其他特征)或具有唯一值的特征。还要检查是否存在类别不平衡(数据中每个类别的样本数量是否有适当的平衡?)。然后尝试应用模型并调整参数以获得更好的结果。你可以使用交叉验证来获得更好的结果。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注