Home IT技术有人能解释一下为什么我们在将数据分割成训练集和测试集时要使用random_state吗？ [duplicate]

有人能解释一下为什么我们在将数据分割成训练集和测试集时要使用random_state吗？ [duplicate]

IT技术 xiaolong · 2025年5月25日 · 0 Comment

我刚开始构建机器学习模型，我想知道为什么在分割数据时需要创建random_state变量。

回答：

它保存了分割的方式。如果你使用相同的数据和相同的random_state，它会生成相同的训练测试分割。这在你想在相同的数据上训练两个或多个模型并比较它们时非常有用。使用相同的数据和相同的随机分割将确保模型是在相同的数据上训练的，从而允许对性能进行苹果对苹果的比较。

cross-validation machine-learning python scikit-learn

发表回复取消回复