我对sklearn中的fit方法有各种疑问。
问题1:当我执行以下操作时:
from sklearn.decomposition import TruncatedSVDmodel = TruncatedSVD()svd_1 = model.fit(X1)svd_2 = model.fit(X2)
变量model的内容在过程中是否有所变化?
问题2:当我执行以下操作时:
from sklearn.decomposition import TruncatedSVDmodel = TruncatedSVD()svd_1 = model.fit(X1)svd_2 = svd_1.fit(X2)
svd_1会发生什么?换句话说,svd_1已经被拟合了,我再次对其进行拟合,它的成分会发生什么变化?
回答:
问题1: 变量model的内容在过程中是否有所变化?
是的。fit方法会修改对象。并且它会返回对象的引用。因此,请注意!在第一个例子中,三个变量model
、svd_1
和svd_2
实际上都指向同一个对象。
from sklearn.decomposition import TruncatedSVDmodel = TruncatedSVD()svd_1 = model.fit(X1)svd_2 = model.fit(X2)print(model is svd_1 is svd_2) # 输出 True
问题2: svd_1会发生什么?
model
和svd_1
指向同一个对象,因此第一个和第二个例子之间完全没有区别。
最后的评论: 在两个例子中,fit(X1)
的结果被fit(X2)
覆盖,正如David Maust在答案中指出的那样。如果你想对两个不同的数据集分别拟合两个不同的模型,你需要这样做:
svd_1 = TruncatedSVD().fit(X1)svd_2 = TruncatedSVD().fit(X2)