Home IT技术在重新训练时应重新标准化训练数据吗？

在重新训练时应重新标准化训练数据吗？

IT技术 xiaolong · 2025年5月31日 · 0 Comment

我正在运行一个简单的Keras深度学习模型，初始训练一次，然后每月根据新数据重新训练。

我的数据由货币值组成，因此我会先使用StandardScaler()来标准化我的数据。然而，当新数据到来需要重新训练时，我可以继续使用同一个StandardScaler对象吗？因为假设新数据的最大值点高于当前的最大值，这将改变整个数据集的标准化。

我应该重新标准化，还是可以对新数据使用相同的标准化方法？

回答：

根据我对您问题的理解，当您使用新的训练数据时，输入数据将与用于计算标准化参数的数据不同。

在这种情况下，新数据输入可能超出您已经标准化的数据值范围。

但是，为了获得一个好的预测模型，训练数据和未来的数据需要具有相近的分布，否则，您的模型将无法按预期工作。

因此，我认为最好重新标准化您的训练数据。并且请确保标准化是在训练集和验证集上分别进行的，即使用训练集的均值来处理验证集，而不是使用验证集的均值：

scaled_train =  (train - train_mean) / train_std_deviationscaled_test = (test - train_mean) / train_std_deviation

auto-keras deep-learning machine-learning standardized

发表回复取消回复