我在使用相同的参数和相同的数据集时,Python的XGBRegressor和R的xgb.train给出的预测结果不同。
我知道XGBRegressor使用的是’gbtree’,我在R中也进行了相应的对比,但是结果仍然不同。
有谁能指导我如何区分这两个工具,或者找到R中与Python的XGBRegressor等效的工具吗?
如果这个问题很傻,请原谅我,谢谢。
回答:
由于XGBoost在底层使用决策树,如果你不固定随机种子,使得拟合过程变得确定性,那么每次拟合可能会得到略有不同的结果。
你可以在R中使用set.seed
,在Python中使用numpy.random.seed
来实现这一点。
根据Gregor的评论,你可能还需要将nthread
参数设置为1,以实现完全的确定性。