我刚开始构建机器学习模型,我想知道为什么在分割数据时需要创建random_state变量。
回答:
它保存了分割的方式。如果你使用相同的数据和相同的random_state,它会生成相同的训练测试分割。这在你想在相同的数据上训练两个或多个模型并比较它们时非常有用。使用相同的数据和相同的随机分割将确保模型是在相同的数据上训练的,从而允许对性能进行苹果对苹果的比较。
我刚开始构建机器学习模型,我想知道为什么在分割数据时需要创建random_state变量。
回答:
它保存了分割的方式。如果你使用相同的数据和相同的random_state,它会生成相同的训练测试分割。这在你想在相同的数据上训练两个或多个模型并比较它们时非常有用。使用相同的数据和相同的随机分割将确保模型是在相同的数据上训练的,从而允许对性能进行苹果对苹果的比较。