Home IT技术 MinMaxScaler如何影响我的测试数据？

MinMaxScaler如何影响我的测试数据？

IT技术 xiaolong · 2025年5月31日 · 0 Comment

假设我想预测股票价格，并且我有训练数据，其中我知道最小值和最大值。这看起来是使用MinMaxScaler的一个好案例，但我在想以下问题。如果我从训练数据中知道最高值被设定为1，当我的测试数据中的股票价格达到比最初归一化为1的值更高的值时，会发生什么情况？它只是覆盖它并将其指定为新的最大值吗？

回答：

在运行这类程序时，sklearn中的缩放器有三个值得注意的方法，你应该使用这些方法：

scaler.fit(x) – 这将设置你的缩放器的最小值和最大值（当使用MinMaxScaler时）为x中找到的值
y_transformed = scaler.transform(y) – 这将使用上述fit命令中找到的参数来转换数据y
x_transformed = scaler.fit_transform(x) 这将同时运行上述两个命令。这应该只应用于你的训练数据。

因此，本质上，当你训练你的模型时，你将在0-1范围内的数据上进行训练，因为你的缩放器将根据这些数据进行拟合。当你获得新数据或测试/验证集中的数据可能超出范围时（使用scaler.transform(y)），这将返回0-1范围之外的数据（例如，1.1或-0.4的值）。

如果这对你使用的算法来说是个问题，我建议无论如何都要将数据剪辑到0-1范围，或者在训练之前（预期）增加缩放器的参数。

batch-normalization large-scale machine-learning

发表回复取消回复