如何调整sklearn Pipeline中RobustScaler的quantile_range?

pipeline = Pipeline([                     ('scale', RobustScaler(quantile_range=()))                     ('classify', OneVsRestClassifier(SVC()))                      ],                     memory=self.memory)

对于给定的pipeline,如何使用GridSearchCV来调整RobustScaler中的quantile_range?默认的quantile_range是(25.0, 75.0)。我想尝试的其他选项包括(5.0, 95.0), (10.0, 90.0), …, (25.0, 75.0)。如何实现这一点?我猜,params_grid应该看起来像这样:

params_grid = [{'scale__quantile_range': ??}]

但我不知道该在问号处填写什么。


回答:

要尝试的超参数应该是一个可迭代对象。试试这样:

from sklearn.preprocessing import RobustScalerfrom sklearn.pipeline import Pipelinefrom sklearn.multiclass import OneVsRestClassifierfrom sklearn.svm import SVCfrom sklearn.model_selection import GridSearchCVfrom sklearn.datasets import make_classificationpipeline = Pipeline([                     ('scale', RobustScaler(quantile_range=())),                     ('classify', OneVsRestClassifier(SVC()))                      ],                     memory=None)params = {"scale__quantile_range":[(25.0,75.0),(10.0,90.0),(1.0,99.0)]}grid_cf = GridSearchCV(pipeline, param_grid=params)X,y = make_classification(1000,10,n_classes=2,random_state=42)grid_cf.fit(X,y)grid_cf.best_params_{'scale__quantile_range': (1.0, 99.0)}

Related Posts

多维度Top-k评分

例如,在机器学习中的自然语言处理中,通常使用波束搜索来…

R – Caret train() “错误:停止” 与 “在newdata中未找到对象中使用的所有变量名”

我正在尝试为蘑菇数据构建一个简单的朴素贝叶斯分类器。我…

创建训练和测试数据集分割,数据嵌套在多个文件夹中

我正在准备数据以训练一个图像识别模型。目前我有一个文件…

我的神经网络预测出现错误:IndexError: list index out of range

我正在进行一个简单的垃圾邮件/非垃圾邮件文本分类。我的…

python 给出数组是一维的,但索引了两个维度错误

我已经为 miniBatchGradientDesce…

TensorFlow自定义训练步骤使用不同的损失函数

背景 根据TensorFlow文档,可以使用以下方式执…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注