我想通过Weka GUI获取错误分类的实例的详细信息(唯一ID)。我参考了这个问题的答案。在那个答案中,他们建议在预处理标签中使用StringToNominal
过滤器来转换唯一ID,这个ID是一个字符串。然而,按照这个方法,我怀疑分类器在分类过程中是否也将唯一ID列视为一个特征?
请建议我正确的处理方法。
如果需要,我很乐意提供示例。
回答:
假设你想(1)添加一个实例ID,(2)在模型中不使用该实例ID,(3)查看带有实例ID和可能其他属性的单个预测结果。
我们将使用一个较小的数据集来展示这一点。例如,打开iris.arff文件。
在预处理标签的无监督属性过滤器中使用AddID过滤器。ID将成为第一个属性。
现在我们需要在建模过程中忽略它。使用带有Remove过滤器的过滤分类器。
我们还需要输出带有ID变量的预测结果,以便我们可以看到发生了什么。我们这里输出所有属性,尽管我们不需要全部输出。
我们在输出窗口中获得以下详细信息:
=== Predictions on test split ===inst#,actual,predicted,error,prediction,ID,sepallength,sepalwidth,petallength,petalwidth1,2:Iris-versicolor,2:Iris-versicolor,,0.968,53,6.9,3.1,4.9,1.52,3:Iris-virginica,3:Iris-virginica,,0.968,131,7.4,2.8,6.1,1.93,2:Iris-versicolor,2:Iris-versicolor,,0.968,59,6.6,2.9,4.6,1.34,1:Iris-setosa,1:Iris-setosa,,1,36,5,3.2,1.2,0.25,3:Iris-virginica,3:Iris-virginica,,0.968,101,6.3,3.3,6,2.56,2:Iris-versicolor,2:Iris-versicolor,,0.968,88,6.3,2.3,4.4,1.37,1:Iris-setosa,1:Iris-setosa,,1,42,4.5,2.3,1.3,0.38,1:Iris-setosa,1:Iris-setosa,,1,8,5,3.4,1.5,0.2
等等。