我在R中对数据运行了一个初始的随机森林模型,并尝试计算特征重要性统计数据。不知为何,我的IncNodePurity测量值全部为0。您知道这可能是什么原因吗,或者我做错了什么?谢谢
rf<- randomForest(target~., data=train,importance=TRUE,proximity=TRUE)round(importance(rf),2)
结果:
%IncMSE IncNodePurityage 1.82 0.00income 6.89 0.00education -0.12 0.00car_ownership 0.99 0.00health_metric 10.34 0.00
谢谢!
回答:
尝试在报告变量重要性时使用更多的小数位数。在我的模型中,IncNodePurity通常低于0.01。如果您只保留两位小数,这些值将显示为0.00。