如何在Weka GUI中识别错误分类的实例的详细信息?

我想通过Weka GUI获取错误分类的实例的详细信息(唯一ID)。我参考了这个问题的答案。在那个答案中,他们建议在预处理标签中使用StringToNominal过滤器来转换唯一ID,这个ID是一个字符串。然而,按照这个方法,我怀疑分类器在分类过程中是否也将唯一ID列视为一个特征?

请建议我正确的处理方法。

如果需要,我很乐意提供示例。


回答:

假设你想(1)添加一个实例ID,(2)在模型中不使用该实例ID,(3)查看带有实例ID和可能其他属性的单个预测结果。

我们将使用一个较小的数据集来展示这一点。例如,打开iris.arff文件。

在预处理标签的无监督属性过滤器中使用AddID过滤器。ID将成为第一个属性。

现在我们需要在建模过程中忽略它。使用带有Remove过滤器的过滤分类器。Remove filter

我们还需要输出带有ID变量的预测结果,以便我们可以看到发生了什么。我们这里输出所有属性,尽管我们不需要全部输出。Ask for instance output with predictions

我们在输出窗口中获得以下详细信息:

=== Predictions on test split ===inst#,actual,predicted,error,prediction,ID,sepallength,sepalwidth,petallength,petalwidth1,2:Iris-versicolor,2:Iris-versicolor,,0.968,53,6.9,3.1,4.9,1.52,3:Iris-virginica,3:Iris-virginica,,0.968,131,7.4,2.8,6.1,1.93,2:Iris-versicolor,2:Iris-versicolor,,0.968,59,6.6,2.9,4.6,1.34,1:Iris-setosa,1:Iris-setosa,,1,36,5,3.2,1.2,0.25,3:Iris-virginica,3:Iris-virginica,,0.968,101,6.3,3.3,6,2.56,2:Iris-versicolor,2:Iris-versicolor,,0.968,88,6.3,2.3,4.4,1.37,1:Iris-setosa,1:Iris-setosa,,1,42,4.5,2.3,1.3,0.38,1:Iris-setosa,1:Iris-setosa,,1,8,5,3.4,1.5,0.2

等等。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注