我想使用RandomForestClassifier来处理67个特征和3000个样本。设置’n_estimators=30’是否意味着在拟合过程中只使用67个特征中的30个?
RandomForestClassifier(n_estimators=30)
回答:
不是的。RandomForest
是一种装袋方法,用于降低一组低偏差高方差分类器(通常默认使用DecisionTree
分类器)的方差。这里的n_estimator
指的是在多数投票系统中使用的这种“过拟合”分类器的数量。
此外,在RandomForest
设置中,通常建议将max_depth
设置为一个相当大的值,以确保每个分类器确实具有低偏差特性。