使用pickle和joblib.dump保存分类器的区别?

在存储使用sklearn训练的分类器时,我可以在pickle(或cPickle)和joblib.dump()之间进行选择。

除了性能之外,使用joblib.dump()还有其他好处吗?用pickle保存的分类器会比用joblib保存的分类器产生更差的结果吗?


回答:

joblib在处理sklearn使用的NumPy数组时表现得特别好,因此根据你使用的分类器类型,你可能会在使用joblib时获得性能和大小上的优势。

否则,pickle也能正常工作,因此保存一个训练好的分类器并再次加载它,无论使用哪种序列化库,都会产生相同的结果。另请参阅关于此主题的sklearn文档

请注意,joblib已包含在sklearn中。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注