我们为某个回归任务训练了一个额外树模型。我们的模型由3个额外树组成,每个额外树包含200棵深度为30的树。在这3个额外树之上,我们使用了岭回归。
我们训练模型花了几个小时,并使用pickle
保存了训练后的模型(整个类对象),以便后续使用。然而,保存的训练模型大小太大了,大约140 GB!
有什么方法可以减小保存模型的大小吗?pickle
中有没有可以帮助的配置,或者有没有pickle
的替代方案?
回答:
在最佳情况下(二叉树),你将会有3 * 200 * (2^30 - 1) = 644245094400
个节点,假设每个节点只需要1字节来存储,那么就是434Gb
。我认为140GB相较之下已经是一个相当不错的尺寸了。