我想对数据集进行归一化和输入选择,但训练集和测试集要分开处理(包括在10折分类的情况下)。
我已经发现,如果使用实验器(experimenter),我可以这样添加特征选择:简单 -> 算法 -> 添加新 -> 元 -> AttributeSelectedClassifier。
如果Weka专家能确认上述方法是否仅在训练集上(而不是完整的训练集和测试集)执行属性选择,那就太好了。
关于我的问题的第二部分,我还没有找到如何对归一化进行处理。我知道某些分类器包括归一化功能,但我使用了多种分类器,并不是所有分类器都具备这一功能。我能在某个地方添加一个归一化过滤器吗?我的审稿人问了这个问题,我不想手动处理10折操作。
回答:
根据我在Weka论坛上提出的问题:我选择了Meta-> FilteredClassifier,然后作为分类器选择了Meta-> AttributeSelectedClassifier,这样应该只会对训练集进行归一化和特征选择。参见参考资料。