在网络应用中,机器学习模型如何更新?
以SKLearn为例,假设你已经用10GB的数据训练了一个庞大的模型,如何根据当天的新数据来更新这个模型呢?
显然,你不希望实时更新,可能是每天结束时更新一次——但我在SKLearn中找不到这样做的方法。你是否需要每天在不断增长的整个数据集上重新训练整个模型?
回答:
sklearn中的许多估计器实现了partial_fit
方法,允许增量(在线)学习。请查看这篇文章。
在网络应用中,机器学习模型如何更新?
以SKLearn为例,假设你已经用10GB的数据训练了一个庞大的模型,如何根据当天的新数据来更新这个模型呢?
显然,你不希望实时更新,可能是每天结束时更新一次——但我在SKLearn中找不到这样做的方法。你是否需要每天在不断增长的整个数据集上重新训练整个模型?
回答:
sklearn中的许多估计器实现了partial_fit
方法,允许增量(在线)学习。请查看这篇文章。