我想按照caret包中的rfe方法,对我的随机森林模型进行特征选择。由于我的数据集只有大约100个标记样本,并且数据集非常不平衡(这反映了现实生活中的平衡),我需要/想要进行分层交叉验证。然而,我没有找到关于rfeControl
函数是否支持分层交叉验证的任何文档。
有谁知道如果我使用
ctrl <- rfeControl(functions = rfFuncs, method = "cv", verbose = FALSE)
回答:
当method ="cv"
时,rfe()
应该使用createFolds()
来创建折叠,这些折叠将根据你的输出变量进行平衡。你可以查看?createFolds
以了解这是如何实现的细节。