归一化和特征选择在Weka中的每折处理

我想对数据集进行归一化和输入选择,但训练集和测试集要分开处理(包括在10折分类的情况下)。

我已经发现,如果使用实验器(experimenter),我可以这样添加特征选择:简单 -> 算法 -> 添加新 -> 元 -> AttributeSelectedClassifier。

如果Weka专家能确认上述方法是否仅在训练集上(而不是完整的训练集和测试集)执行属性选择,那就太好了。

关于我的问题的第二部分,我还没有找到如何对归一化进行处理。我知道某些分类器包括归一化功能,但我使用了多种分类器,并不是所有分类器都具备这一功能。我能在某个地方添加一个归一化过滤器吗?我的审稿人问了这个问题,我不想手动处理10折操作。


回答:

根据我在Weka论坛上提出的问题:我选择了Meta-> FilteredClassifier,然后作为分类器选择了Meta-> AttributeSelectedClassifier,这样应该只会对训练集进行归一化和特征选择。参见参考资料。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注