Home IT技术训练的机器学习模型太大

训练的机器学习模型太大

IT技术 xiaolong · 2025年4月12日 · 0 Comment

我们为某个回归任务训练了一个额外树模型。我们的模型由3个额外树组成，每个额外树包含200棵深度为30的树。在这3个额外树之上，我们使用了岭回归。

我们训练模型花了几个小时，并使用pickle保存了训练后的模型（整个类对象），以便后续使用。然而，保存的训练模型大小太大了，大约140 GB！

有什么方法可以减小保存模型的大小吗？pickle中有没有可以帮助的配置，或者有没有pickle的替代方案？

回答：

在最佳情况下（二叉树），你将会有3 * 200 * (2^30 - 1) = 644245094400个节点，假设每个节点只需要1字节来存储，那么就是434Gb。我认为140GB相较之下已经是一个相当不错的尺寸了。

machine-learning pickle python random-forest

发表回复取消回复