为什么在RidgeCV中使用alphas=alphas?

我需要实现Lasso和Ridge回归,并通过交叉验证计算超参数。我找到了实现这个功能的代码,但有些地方不太理解。

lassocv = LassoCV(alphas=None, cv=15, max_iter=100000, normalize=True)lassocv.fit(X_train, y_train)lasso = Lasso(alpha=lassocv.alpha_, normalize=True)lasso.fit(X_train, y_train)rmse = np.sqrt(mean_squared_error(y_val, lasso.predict(X_val)))ridgecv = RidgeCV(alphas=alphas, normalize=True)ridgecv.fit(X_train, y_train)ridge = Ridge(alpha=ridgecv.alpha_, normalize=True)ridge.fit(X_train, y_train)rmse = np.sqrt(mean_squared_error(y_val, ridge.predict(X_val)))

那么,为什么在RidgeCV中使用alphas=alphas?如果我写成alphas=None,会出现错误。为什么ridgecv不需要写cv参数呢?


回答:

我认为答案与不同模型上设置正则化强度的方式有关。

在RidgeCV中,你需要显式地声明alpha,因为参数调整不是基于交叉验证计算的误差进行的。

然而,在LassoCV中,他们有从CV误差中自动计算alpha的方法。不过,如果你想显式地设置它们,可以通过更改可选参数n_alphaalphas来实现。

参考:https://web.stanford.edu/~hastie/Papers/ESLII.pdf第7章第4节以获取更多详情。

Related Posts

为什么我们在K-means聚类方法中使用kmeans.fit函数?

我在一个视频中使用K-means聚类技术,但我不明白为…

如何获取Keras中ImageDataGenerator的.flow_from_directory函数扫描的类名?

我想制作一个用户友好的GUI图像分类器,用户只需指向数…

如何查看每个词的tf-idf得分

我试图了解文档中每个词的tf-idf得分。然而,它只返…

如何修复 ‘ValueError: Found input variables with inconsistent numbers of samples: [32979, 21602]’?

我在制作一个用于情感分析的逻辑回归模型时遇到了这个问题…

如何向神经网络输入两个不同大小的输入?

我想向神经网络输入两个数据集。第一个数据集(元素)具有…

逻辑回归与机器学习有何关联

我们正在开会讨论聘请一位我们信任的顾问来做机器学习。一…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注