如何获取RandomForest()
中特征的系数,就像逻辑回归中的model.coef_那样?
model = GridSearchCV(estimator=classifier, param_grid=grid_param, scoring='roc_auc', cv=5, n_jobs=-1) best_model= model.fit(X_train, y_train)best_model.feature_importances_
回答:
随机森林
是由决策树
组成的集成模型,它不是一个线性模型。Sklearn提供了用于训练随机森林分类器或回归器的各个特征的重要性。可以通过以下方式访问,返回一个总和为1的小数数组。
model.feature_importances_
如果你想结合特征名称查看这些重要性,可以使用zip(<特征名称>, model.feature_importances_)
,并将其转换为list
。