我使用scikit-learn的GridSearchCV
来对多种超参数进行网格搜索。在GridSearchCV
完成后,我可以通过访问grid_search_object.cv_results_
将网格搜索的输出写入CSV文件。
然而,我希望在每个配置完成后立即将其输出写入CSV文件,而不是一次性写入。有没有办法做到这一点?
回答:
一个解决方法是将GridSearchCV
的verbose
属性设置为3,这样候选参数和分数就会被记录下来,并将日志输出捕获到一个文件中。你可以按以下方式操作:
from sklearn import svm, datasetsfrom sklearn.model_selection import GridSearchCVimport sysold_stdout = sys.stdoutlog_file = open("cv.log","w")sys.stdout = log_fileiris = datasets.load_iris()parameters = {'kernel':('linear', 'rbf'), 'C':[1, 10]}svc = svm.SVC()clf = GridSearchCV(svc, parameters, verbose=3)clf.fit(iris.data, iris.target)sys.stdout = old_stdoutlog_file.close()
这将把每次迭代的结果以及参数写入文件中。下面是一个cv.log
文件内容的示例:
Fitting 5 folds for each of 4 candidates, totalling 20 fits[CV 1/5] END ................C=1, kernel=linear;, score=0.967 total time= 0.0s[CV 2/5] END ................C=1, kernel=linear;, score=1.000 total time= 0.0s[CV 3/5] END ................C=1, kernel=linear;, score=0.967 total time= 0.0s[CV 4/5] END ................C=1, kernel=linear;, score=0.967 total time= 0.0s[CV 5/5] END ................C=1, kernel=linear;, score=1.000 total time= 0.0s