我在尝试用新的数据集测试我的模型。我已经对新数据集进行了与构建模型时相同的预处理步骤。我已经比较了两个文件,没有发现问题。我确保了训练集和测试集中所有属性的顺序、属性名称和数据类型都相同。但我仍然无法解决这个问题。训练文件和测试文件看起来非常相似,但Weka浏览器仍然提示“训练集和测试集不兼容”的错误。如何解决这个错误?有没有办法将test.arff文件的格式调整为与train.arff相同?请有人帮帮我。
回答:
与我在问题陈述后留下的评论相同:
所有三个属性都是名义属性,后面跟着用'{}’括起来的所有可能值。我的一个猜测是这些可能的值并不相同。例如,对于RESOURCE属性,测试文件中没有199,而训练文件中有。