library(glmnet)library(boot)data(iris)x <- model.matrix(Sepal.Length~., iris)[,-1]y <- iris$Sepal.Lengthm <- cv.glmnet(x, y)> cv.glm(x, m, K = 10)Error in UseMethod("predict") : no applicable method for 'predict' applied to an object of class "c('matrix', 'double', 'numeric')"
或
bestLambda = m$lambda.minm2 <- glmnet(x, y, family = "gaussian", lambda = bestLambda)>cv.glm(x, m2, K = 10) Error in glmnet(x = x, y = y, family = "gaussian", lambda = bestLambda, : unused argument (data = c(3.5, 3, 3.2, 3.1, 3.6,
参考这个问题,我试图使用cv.glm
来获取我的Elastic net模型的K折交叉验证预测误差,但由于错误我无法做到。我不太确定cv.glm
函数是否可以用来计算cv.glm
或glmnet
对象的预测误差。
回答:
我认为你混淆了glm
和glmnet
(带有Lasso和Ridge惩罚的Elastic net)。cv.glm
期望的是一个glm
模型,而不是glmnet
模型。
尝试以下两种方法之一:
-
使用
glmnet
和cv.glmnet
来计算K折交叉验证误差,如下所示:library(glmnet)library(boot)data(iris)x <- model.matrix(Sepal.Length~., iris)[,-1]y <- iris$Sepal.Lengthm <- cv.glmnet(x, y, nfolds=10)m$lambda.min#[1] 0.0003839539m$lambda.1se#[1] 0.009078549plot(m$lambda, m$cvm,type='l', xlab=expression(lambda), ylab='CV errors', main=expression(paste('CV error for different ', lambda)))lines(m$lambda, m$cvup, col='red')lines(m$lambda, m$cvlo, col='red')
[已编辑]
在训练数据集上的预测误差:
mean((y-predict(m, newx=x))^2)# [1] 0.1037433
- 拟合一个
glm
模型,并使用cv.glm
计算交叉验证误差delta(无正则化)。根据cv.glm
的文档说明:
delta: 一个长度为二的向量。第一个分量是预测误差的原始交叉验证估计。第二个分量是调整后的交叉验证估计。该调整旨在补偿不使用留一法交叉验证引入的偏差。
df <- cbind.data.frame(x, y)m <- glm(y~., df, family='gaussian')cv.glm(df, m, K = 10)$delta # [1] 0.09992177 0.09940190