我正在使用sklearn的随机森林分类器(RFC)。
forest.fit(training_data, y_train)probas_test = forest.predict_proba(test_data)
我想知道是否有方法可以找出导致预测的每个特征的贡献/重要性。
类似于,但针对单个数据点级别。
forest.feature_importances_
回答:
这个问题可以通过多种方式解决;请查看 http://blog.datadive.net/interpreting-random-forests/ (以及相关的Python包:https://github.com/andosa/treeinterpreter)。还有其他不太直接的选项,例如: