Home IT技术在应用标签编码器后使用标准化缩放器有意义吗？

在应用标签编码器后使用标准化缩放器有意义吗？

IT技术 xiaolong · 2025年5月27日 · 0 Comment

我正在开始一个项目，数据集中一个类别包含超过5000个唯一值。

我的问题是，在使用标签编码器“枚举”类别之后，使用标准化缩放器来使数据对我的机器学习模型更“易于管理”，是否有意义？

请注意，我总共有超过50万条记录，而这个特定列有5000个唯一类别。

这更多是关于背后的直觉，而不是如何编程，但我认为这里应该是最适合提问的地方。

回答：

LabelEncoder 应该用于标签，以便将n个类别的标签替换为从1到n的整数。如果尚未完成，你应该这样做。

StandardScaler 最终应该用于训练和测试数据，但不用于标签。它输出正或负的float。

你绝对不应该将此应用于标签列，因为标签列必须是正的Integer。

label-encoding machine-learning python

发表回复取消回复