决策树产生不同的输出

我目前正在使用决策树（使用Scikit Learn）来预测某些值。我遇到的问题是算法的输出不一致。这是决策树的特性吗？在多次运行中（数据和算法没有变化），我得到了不同的结果。

我开始时使用了Scikit的决策树类，没有做任何更改

svr = DecisionTreeRegressor()

然后，为了消除任何“随机性”，我将其更改为

svr = DecisionTreeRegressor(splitter='best', random_state=None)

是什么导致了不同的结果？如何防止这种情况发生？

以下是两个结果（为了简单起见进行了绘制），红色是决策树回归的结果，蓝色是测试集。

回答：

来自文档：

random_state : int, RandomState实例或None，可选（默认=None）

如果是int，random_state是随机数生成器使用的种子；如果是RandomState实例，random_state是随机数生成器；如果是None，随机数生成器是np.random使用的RandomState实例。

对于None，它将使用np.random，这也是随机的。要制作可重现的示例，您需要在random_state中指定int数字。例如：

svr = DecisionTreeRegressor(random_state=1)

在您的案例中，您正在做：

svr = DecisionTreeRegressor(splitter='best', random_state=None)

这与random_state的默认行为相同。

学技术

决策树产生不同的输出

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复