我是scikit-learn和随机森林回归的新手,我想知道是否有简单的方法可以获得随机森林中每一棵树的预测结果,而不仅仅是综合预测结果。
基本上我想实现的是在R语言中可以通过predict.all = True
选项实现的功能。
# 导入我们使用的模型from sklearn.ensemble import RandomForestRegressor# 用1000棵决策树实例化模型rf = RandomForestRegressor(n_estimators = 1000, random_state = 1337)# 在训练数据上训练模型rf.fit(train_features, train_labels)# 在测试数据上使用森林的预测方法predictions = rf.predict(test_features)print(len(predictions)) #6565,这是我的测试集的观测数量。
我希望获得每棵树对每个预测的每一个单独的预测结果,而不仅仅是它们的平均值。
在Python中是否可以实现这一点?
回答:
使用
import numpy as nppredictions_all = np.array([tree.predict(X) for tree in rf.estimators_])print(predictions_all.shape) #(1000, 6565) 1000行:每棵树一行,6565列,每个目标一个
这使用了estimators_
属性(参见文档),它是所有已训练的DecisionTreeRegressors的列表。我们可以对其中的每一个调用predict方法,并将结果保存到数组中。