我正在使用 python
和 scikit-learn
进行一些分类工作。
是否可以重用分类器学习到的参数?
例如:
from sklearn.svm import SVCcl = SVC(...) # 创建具有某些超参数的SVM分类器cl.fit(X_train, y_train)params = cl.get_params()
让我们将这个 params
存储为字符串字典,甚至可以将其写入JSON文件。假设我们稍后想使用这个训练好的分类器对某些数据进行预测。尝试恢复它:
params = ... # 从某处检索这些存储为字典的参数data = ... # 我们想要进行预测的数据cl = SVC(...)cl.set_params(**params)predictions = cl.predict(data)
如果我这样做,我会得到 NonFittedError
以及以下堆栈跟踪:
File "C:\Users\viacheslav\Python\Python36-32\lib\site-packages\sklearn\svm\base.py", line 548, in predict y = super(BaseSVC, self).predict(X) File "C:\Users\viacheslav\Python\Python36-32\lib\site-packages\sklearn\svm\base.py", line 308, in predict X = self._validate_for_predict(X) File "C:\Users\viacheslav\Python\Python36-32\lib\site-packages\sklearn\svm\base.py", line 437, in _validate_for_predict check_is_fitted(self, 'support_') File "C:\Users\viacheslav\Python\Python36-32\lib\site-packages\sklearn\utils\validation.py", line 768, in check_is_fitted raise NotFittedError(msg % {'name': type(estimator).__name__})sklearn.exceptions.NotFittedError: This SVC instance is not fitted yet. Call 'fit' with appropriate arguments before using this method.
是否可以在不拟合的情况下为分类器设置参数并进行预测?我该如何操作?
回答:
请阅读关于 SKLearn中的模型持久化 的内容:
from sklearn.externals import joblibjoblib.dump(clf, 'filename.pkl')
稍后:
clf = joblib.load('filename.pkl')