我尝试使用 Weka 的 OneClassClassifier 类对测试数据集中的一些实例进行分类。
我使用一个不同的训练数据集对分类器进行了训练。测试集和训练集(arff 文件)具有相同的属性结构,但测试集不包含任何类别值。
使用的分类器选项是 -tcl myclass
(用于设置我的目标类别)。
运行 distributionForInstance(Instance)
方法时,我得到了以下错误:
java.lang.ArrayIndexOutOfBoundsException: 3 # weka.core.DenseInstance.value(weka/core/DenseInstance.java:332) # weka.core.AbstractInstance.isMissing(weka/core/AbstractInstance.java:315) # weka.filters.unsupervised.attribute.AddValues.input(weka/filters/ unsupervised/attribute/AddValues.java:315) # weka.classifiers.meta.OneClassClassifier.distributionForInstance(weka/ classifiers/meta/OneClassClassifier.java:1380)
使用其他分类器(例如 trees.RandomForest, functions.Logistic),我的程序可以成功运行。我做错了什么?
回答:
我刚刚找到了一个解决方案:
因为我的测试集没有分配任何类别值,所以当通过无监督属性 AddValues
过滤器添加“outlier”类别标签时,没有值可以加载。
当我使用
instance.setClassMissing();
将实例的类别值设置为缺失时,程序可以正常运行,错误也随之消失。