我在尝试使用R进行特征选择。我使用glmnet包来完成这个任务。以下是我目前的代码:
lasso_model = glmnet(as.matrix(x = lasso, y = lasso_target, standardize=TRUE, alpha=1))
lasso是一个包含数值和分类预测变量的数据框。我已经删除了第一列的目标变量。
lasso_target是我删除并存储为独立数据框的目标变量。
错误信息如下:
Error in drop(y) : argument "y" is missing, with no default
我的目标是在将数据框输入模型之前移除无信息量的特征。任何帮助都将不胜感激!
回答:
你接近正确了!但输入变量和响应变量需要单独定义。你现在做的是将它们都合并到一个矩阵中(另外还包括glmnet的其他参数),然后将整个矩阵传递给函数。由于x是默认的第一个参数,它假定这是输入矩阵,然后因为没有定义y参数,它无法找到响应变量。因此,你会收到一个错误,告诉你缺少y参数。
以下代码应该能解决问题:
lasso_model <- glmnet(x = as.matrix(lasso), y = as.matrix(lasso_target), standardize=TRUE, alpha=1)