我是一个初学者,正在制作一个线性回归模型。当我基于测试集进行预测时,一切正常。但是当我尝试为一个特定值进行预测时,它会报错。我正在观看的教程中,他们并没有遇到任何错误。
dataset = pd.read_csv('Position_Salaries.csv')X = dataset.iloc[:, 1:2].valuesy = dataset.iloc[:, 2].values# Fitting Linear Regression to the datasetfrom sklearn.linear_model import LinearRegressionlin_reg = LinearRegression()lin_reg.fit(X, y)# Visualising the Linear Regression resultsplt.scatter(X, y, color = 'red')plt.plot(X, lin_reg.predict(X), color = 'blue')plt.title('Truth or Bluff (Linear Regression)')plt.xlabel('Position level')plt.ylabel('Salary')plt.show()# Predicting a new result with Linear Regressionlin_reg.predict(6.5)
值错误:期望是二维数组,但得到的是标量数组:array=6.5。请使用array.reshape(-1, 1)重塑你的数据,如果你的数据只有一个特征,或者使用array.reshape(1, -1)如果它包含一个样本。
回答:
根据Scikit-learn文档,输入数组的形状应为(n_samples, n_features)
。因此,如果你想要一个单一的例子和一个单一的值,你应该期望你的输入形状为(1,1)
。
这可以通过以下方式实现:
import numpy as nptest_X = np.array(6.5).reshape(-1, 1)lin_reg.predict(test_X)
你可以通过以下方式检查形状:
test_X.shape
之所以这样做,是因为输入可以有多个样本(即你想一次预测多个数据点),或者/和每个样本可以有多个特征。
注意:Numpy是一个支持大型数组和矩阵的Python库。当安装scikit-learn时,Numpy也应该被安装。