标准化机器学习算法的输入

我想对多个机器学习算法(如神经网络)和逻辑回归的预测变量进行标准化处理(如z-score、最小-最大值等),我有以下疑问:

1) 我应该对整个预测变量进行标准化处理吗,也就是说包括训练数据和测试数据?

2) 我应该对预测变量y进行标准化处理吗?


回答:

1) 正确的做法是标准化你的训练数据,并使用这些转换参数来标准化测试数据。以下是一个单一特征的最小-最大值标准化的例子:

training = [1, 2, 3]test = [0, 4]

标准化后的数据如下:

training_normalized = [0.0, 0.5, 1.0]test_normalized = [-0.5, 1.5]

2) 通常答案是否定的,但有些情况下对目标变量进行转换可能会有所帮助。无论如何,你应该确保你的模型输出能够与目标变量匹配。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注