我在R
中尝试使用随机森林来预测一个连续变量(计数)。预测变量的值范围是min=1
和max=1000
。
我尝试使用“confusionMatrix”来获取预测准确性,但自然地,我得到了预测和被预测值之间不同级别数量的错误。
在这种情况下,获取预测准确性的最佳方法是什么?
回答:
@ 用户名
大致来说,均方根误差可以理解为实际值和拟合值之间的标准化偏差。可以通过以下方式获得。
library(randomForest)set.seed(1237)iris.rg <- randomForest(Sepal.Length ~ ., data=iris, importance=TRUE, proximity=TRUE)sqrt(sum((iris.rg$predicted - iris$Sepal.Length)^2) / nrow(iris))[1] 0.3706187