如何将训练好的朴素贝叶斯分类器保存到磁盘并使用它来预测数据?
我从scikit-learn网站上找到了以下示例程序:
from sklearn import datasets
iris = datasets.load_iris()
from sklearn.naive_bayes import GaussianNB
gnb = GaussianNB()
y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)
print "Number of mislabeled points : %d" % (iris.target != y_pred).sum()
回答:
分类器只是可以像其他对象一样被序列化和保存的对象。继续你的示例:
import cPickle
# 保存分类器
with open('my_dumped_classifier.pkl', 'wb') as fid:
cPickle.dump(gnb, fid)
# 再次加载
with open('my_dumped_classifier.pkl', 'rb') as fid:
gnb_loaded = cPickle.load(fid)