用于sklearn随机回归的正则化参数设置

我在使用sklearn的随机回归,例如随机逻辑回归。由于随机逻辑回归使用L1惩罚,需要设置正则化参数C(或Lasso中的alpha)。

为了找到C的合适值,我通常使用简单的GridSearchCV,如下所示。

但是,RandomizedLogisticRegression()不支持GridSearchCV,因为它包含了自助法(bootstrapping)。因此,我尝试使用典型的LogisticRegression与GridSearchCV结合使用。

params = {'C':[0.1, 1, 10]}logi = LogisticRegression(penalty='l1')clf = GridSearchCV(logi, params, cv=10)

通过这种方式,我可以得到C的值,然而,当我将这个C值应用到随机逻辑回归时,没有属性被选中。可能是GridSearchCV选择的C值太低了。

因此,我想知道在使用随机回归时,是否有其他好的方法来确定C(或alpha)的合理值。

之前有一个类似的问题,但我认为那个答案是针对典型回归的。

谁能给我一些建议吗?


回答:

因为RandomizedLogisticRegression用于特征选择,它需要作为管道的一部分进行交叉验证。你可以将GridSearchCV应用于包含它的Pipeline,作为特征选择步骤以及你选择的分类器。一个例子可能是这样的:

pipeline = Pipeline([  ('fs', RandomizedLogisticRegression()),  ('clf', LogisticRegression())])params = {'fs__C':[0.1, 1, 10]}grid_search = GridSearchCV(pipeline, params)

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注