Home IT技术训练/验证/测试中标准化或归一化参数的使用

训练/验证/测试中标准化或归一化参数的使用

IT技术 xiaolong · 2025年5月22日 · 0 Comment

最佳做法是标准化/归一化训练集，然后使用其参数（归一化的min & max，标准化的mean & std）来标准化/归一化验证集。

我想知道的是，如果验证集中有不同的最小值/最大值，从而导致数值范围不再在区间(0,1)内，会有什么影响？

这如何影响神经网络的训练？

最后一个疑问：当我们使用测试集来评估模型对未见过数据的表现时，我们是否应该再次使用训练参数来标准化/归一化数据？因为这些参数实际上与训练的模型紧密相关。

回答：

当你进行缩放时，你通常知道数据的范围：

对于图像，从0-255缩放到0-1，这是可以的，你事先知道范围
对于其他特征，你缩放的不是均匀分布，而是高斯分布，在这种情况下，输出不应受限于[0,1]区间（或[-1,1]）。

因此，通常情况下，如果你知道想要什么样的输出（概率或图像），你也会知道输入的实际完整范围。

当你不知道输入范围时，你通常不希望在输出处使用sigmoid函数，因为这会比应该的更多地限制你的网络。

是的，你需要使用与训练数据相同的预处理流程，意味着使用训练的归一化参数。

batch-normalization data-processing machine-learning

发表回复取消回复