我在使用Weka的LibSVM包装器训练模型时,该包装器提供了一个对训练数据进行归一化的选项。当将此模型应用于新的实例(测试数据)时,Weka会自动使用训练数据的相同均值进行归一化,还是我需要明确地进行这一操作?
回答:
Instances train_data = ... Instances test_data = ... Standardize filter = new Standardize();filter.setInputFormat(train_data); Instances normalizedTrain_data = Filter.useFilter(train_data, filter); Instances normalizedTest_data = Filter.useFilter(test_data, filter);
如您所见,过滤器是使用训练数据初始化的,并且该过滤器同时应用于训练数据和测试数据。