Home IT技术如何使用GridSearchCV确定的最佳参数

如何使用GridSearchCV确定的最佳参数

IT技术 xiaolong · 2025年5月24日 · 0 Comment

我正在使用GridSearchCV来识别最佳参数，但我不知道如何实际使用这些最佳参数。也就是说，在下面的代码中，第三行在更改第一行后（例如，如果我更改参数空间，或将recall替换为precision等），我的结果没有变化。

cv = GridSearchCV(pipeline, parameters, cv=len(range(2014,2019)), scoring='recall', refit=True)cv.fit(X,y)y_pred = cross_val_predict(cv, X, y, cv=len(range(2014,2019)))

有没有一种方法可以确保在GridSearchCV中确定的任何最佳参数在以后调用cv.predict时也实际被使用？

回答：

除非您设置refit=False，否则GridSearchCV默认已经做了您想要的事情。正如GridSearchCV的文档所述：

refit : boolean, or string, default=True
使用在整个数据集上找到的最佳参数重新拟合一个估计器。

对于多指标评估，这需要是一个字符串，表示用于找到重新拟合估计器的最佳参数的评分器。

重新拟合的估计器可以在best_estimator_属性中获得，并且允许直接在这个GridSearchCV实例上使用predict。

同样，对于多指标评估，只有在设置了refit的情况下，属性best_index_、best_score_和best_params_才可用，并且所有这些都将根据此特定评分器来确定。

请参阅scoring参数以了解更多关于多指标评估的信息。

因此，每当您调用cv.predict时，最佳估计器（已重新拟合）会进行预测。

在您的情况下，结果可能是相同的，可能是由于最佳估计器在所有指标上都得分最高。

cross-validation grid-search machine-learning python scikit-learn

发表回复取消回复