我首先进行了训练/测试数据分割,然后将数据拟合到下面的LinearRegression模型中
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.4, random_state = 101)Log_m = LinearRegression()Log_m.fit(X_train,y_train)predictions = Log_m.predict(X_test)
我得到了另一个测试数据框,并希望将其拟合到已经创建的Log_m模型中。所以我做了如下操作
predictions_t = Log_m.predict(fin_df1_t)
但我得到了以下错误信息:
ValueError: shapes (1450,262) and (282,) not aligned: 262 (dim 1) != 282 (dim 0)
这些是数据框的形状
fin_df1_t (1450,262)X_test (556,282)X_train (834,282)y_test (556,)y_train (834,)
回答:
新测试数据的特征列数(262)与Xtrain和Xtest的特征列数(282)不相等,因此总是会报错。两者应该具有相同的特征列。例如,Xtrain和Xtest具有相同的列数(282),所以在那个步骤中没有错误。