条件推断树在R语言party包中的应用:如何基于OOB数据预测模型和变量重要性?

我在R语言中使用party包的cforest函数来计算条件推断树。与随机森林类似,我想获取基于OOB数据的解释方差和变量重要性(我读到随机森林会返回基于OOB数据的解释方差和变量重要性)。为此,我使用了以下代码:

model <- party::cforest(y ~ x1 + x2 + x3 + x4 , data=trainings_set ,  control=cforest_unbiased(ntree=1000, minsplit=25 , minbucket=8 , mtry=4))model.pred <- predict(model, type="response" , OOB=TRUE)R2=1 - sum((trainings_set$y-model.pred)^2)/sum((trainings_set$y-mean(trainings_set$y))^2)varimp_model=party::varimp(model, conditional = TRUE, threshold = 0.2, OOB = TRUE)

我想知道OOB=TRUE命令是否会导致模型预测和变量重要性基于训练集的OOB数据返回?

我之前在不同的标题下发布过这个问题,现在重新发布(稍作修改),希望有人能提供答案?


回答:

cforest函数中的OOB参数用于定义袋外预测的逻辑值。

只有当你在cforest中传递newdata参数时(通常是一个测试数据框架),这个参数才为TRUE。如果newdata参数存在并且你设置了OOB=TRUE,那么你将在这个newdata上获得袋外预测

希望这能解答你的疑问。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注