用于sklearn随机回归的正则化参数设置

我在使用sklearn的随机回归，例如随机逻辑回归。由于随机逻辑回归使用L1惩罚，需要设置正则化参数C（或Lasso中的alpha）。

为了找到C的合适值，我通常使用简单的GridSearchCV，如下所示。

但是，RandomizedLogisticRegression()不支持GridSearchCV，因为它包含了自助法（bootstrapping）。因此，我尝试使用典型的LogisticRegression与GridSearchCV结合使用。

params = {'C':[0.1, 1, 10]}logi = LogisticRegression(penalty='l1')clf = GridSearchCV(logi, params, cv=10)

通过这种方式，我可以得到C的值，然而，当我将这个C值应用到随机逻辑回归时，没有属性被选中。可能是GridSearchCV选择的C值太低了。

因此，我想知道在使用随机回归时，是否有其他好的方法来确定C（或alpha）的合理值。

之前有一个类似的问题，但我认为那个答案是针对典型回归的。

谁能给我一些建议吗？

回答：

因为RandomizedLogisticRegression用于特征选择，它需要作为管道的一部分进行交叉验证。你可以将GridSearchCV应用于包含它的Pipeline，作为特征选择步骤以及你选择的分类器。一个例子可能是这样的：

pipeline = Pipeline([  ('fs', RandomizedLogisticRegression()),  ('clf', LogisticRegression())])params = {'fs__C':[0.1, 1, 10]}grid_search = GridSearchCV(pipeline, params)

学技术

用于sklearn随机回归的正则化参数设置

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复