from sklearn.neighbors import KNeighborsClassifier
knn_clf = KNeighborsClassifier()
knn_clf.fit(x_train[:92000],y_train[:92000]) #第一次调用
knn_clf.fit(x_train[92000:123000],y_train[92000:123000]) #第二次调用
我的疑问是,当我像这样调用fit方法时,第二次调用是否会从头开始重新训练模型?还是会基于第一次调用(第一次方法调用)所学到的内容进行添加?
我尝试实现的是分批训练,因为如果一次性使用完整数据集,我的笔记本电脑无法处理!提前感谢 🙂
回答:
每次调用fit方法时,它都会尝试拟合模型。如果你多次调用fit方法,它会尝试重新拟合模型。正如@某人指出,分批训练对KNN来说没有任何意义。
KNN会考虑所有数据点并选择最接近的K个邻居。因此,如果你的数据量很大,它将需要更多时间。
你能做的就是缩小你的数据规模或增加系统内存大小。