我想使用caret
包在循环中训练多个模型(每个响应变量一个模型)。
我的数据框data
有46个预测变量(所有这些变量都用于训练所有模型)和7个响应变量。
我尝试了一些R代码,但失败了:
models.list = list()Ynames = names(data)[47:ncol(data)]for(y in Ynames){models.list[[y]] = train(as.name(y)~., subset(data,select=-Ynames[-y]),method="".....)}
我的变量Ynames
包含所有响应变量。每个模型必须使用单个响应变量进行训练。因此,在第一次迭代中,我们将为Ynames[1]
响应变量和所有46个预测变量训练模型,但有必要从数据集data
中排除所有非第一响应变量(Ynames[-1]
)。
回答:
这可能是一个替代方案,符合您的示例(使用iris数据集)。子集选择基于这个帖子:使用subset从数据框中移除列列表
models.list = list()Ynames = names(iris)[3:ncol(iris)]for(y in Ynames){ to.remove <- Ynames[!Ynames==y] `%ni%` <- Negate(`%in%`) models.list[[y]] = train(as.name(y)~., subset(iris,select = names(iris) %ni% to.remove),method="".....)}