在存储使用sklearn训练的分类器时,我可以在pickle(或cPickle)和joblib.dump()之间进行选择。
除了性能之外,使用joblib.dump()还有其他好处吗?用pickle保存的分类器会比用joblib保存的分类器产生更差的结果吗?
回答:
joblib在处理sklearn使用的NumPy数组时表现得特别好,因此根据你使用的分类器类型,你可能会在使用joblib时获得性能和大小上的优势。
否则,pickle也能正常工作,因此保存一个训练好的分类器并再次加载它,无论使用哪种序列化库,都会产生相同的结果。另请参阅关于此主题的sklearn文档。
请注意,joblib已包含在sklearn中。