部分拟合和热启动有什么区别？

背景：

我在使用scikit库中的被动攻击器（Passive Aggressor），对是否应该使用热启动还是部分拟合感到困惑。

迄今为止的努力：

参考了这个讨论线程：

https://github.com/scikit-learn/scikit-learn/issues/1585

查看了scikit代码中的_fit和_partial_fit部分。

我的观察：

_fit 实际上调用了 _partial_fit。
当设置了 warm_start 时，_fit 会调用 _partial_fit 并传入 self.coef_ 参数。
当调用 _partial_fit 且没有传入 coef_init 参数，同时 self.coef_ 已设置时，它会继续使用 self.coef_。

问题：

我觉得它们最终提供的功能是相同的。那么，它们之间的基本区别是什么？在哪些情况下使用它们中的每一个？

我是否遗漏了显而易见的内容？任何帮助都将不胜感激！

回答：

我对被动攻击器不太了解，但至少在使用SGDRegressor时，partial_fit 只会拟合1个周期，而 fit 会拟合多个周期（直到损失收敛或达到 max_iter）。因此，当为模型拟合新数据时，partial_fit 只会朝新数据调整模型一步，但使用 fit 和 warm_start 时，它会像是将旧数据和新数据结合起来，并一次拟合模型直到收敛。

示例：

from sklearn.linear_model import SGDRegressorimport numpy as npnp.random.seed(0)X = np.linspace(-1, 1, num=50).reshape(-1, 1)Y = (X * 1.5 + 2).reshape(50,)modelFit = SGDRegressor(learning_rate="adaptive", eta0=0.01, random_state=0, verbose=1,                     shuffle=True, max_iter=2000, tol=1e-3, warm_start=True)modelPartialFit = SGDRegressor(learning_rate="adaptive", eta0=0.01, random_state=0, verbose=1,                     shuffle=True, max_iter=2000, tol=1e-3, warm_start=False)# 首先拟合一些数据modelFit.fit(X, Y)modelPartialFit.fit(X, Y)# 对于两者：在50个周期后收敛，范数：1.46，NNZs：1，偏置：2.000027，T：2500，平均损失：0.000237print(modelFit.coef_, modelPartialFit.coef_) # 对于两者：[1.46303288]# 现在拟合新数据（零）newX = XnewY = 0 * Y# 仅拟合1个周期，范数：1.23，NNZs：1，偏置：1.208630，T：50，平均损失：1.595492：modelPartialFit.partial_fit(newX, newY)# 在49个周期后收敛，范数：0.04，NNZs：1，偏置：0.000077，T：2450，平均损失：0.000313：modelFit.fit(newX, newY)print(modelFit.coef_, modelPartialFit.coef_) # [0.04245779] vs. [1.22919864]newX = np.reshape([2], (-1, 1))print(modelFit.predict(newX), modelPartialFit.predict(newX)) # [0.08499296] vs. [3.66702685]

学技术

部分拟合和热启动有什么区别？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复