Sklearn中的fit方法。当使用KNeighborsClassifier时

from sklearn.neighbors import KNeighborsClassifier
knn_clf = KNeighborsClassifier()
knn_clf.fit(x_train[:92000],y_train[:92000]) #第一次调用
knn_clf.fit(x_train[92000:123000],y_train[92000:123000]) #第二次调用

我的疑问是,当我像这样调用fit方法时,第二次调用是否会从头开始重新训练模型?还是会基于第一次调用(第一次方法调用)所学到的内容进行添加?

我尝试实现的是分批训练,因为如果一次性使用完整数据集,我的笔记本电脑无法处理!提前感谢 🙂


回答:

每次调用fit方法时,它都会尝试拟合模型。如果你多次调用fit方法,它会尝试重新拟合模型。正如@某人指出,分批训练对KNN来说没有任何意义。

KNN会考虑所有数据点并选择最接近的K个邻居。因此,如果你的数据量很大,它将需要更多时间。

你能做的就是缩小你的数据规模或增加系统内存大小。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注