我为SVR回归器编写了以下代码
# SVR# 导入库import numpy as npimport matplotlib.pyplot as pltimport pandas as pd# 导入数据集dataset = pd.read_csv('Position_Salaries.csv')X = dataset.iloc[:, 1:2].valuesy = dataset.iloc[:, 2].values# 将数据集拆分为训练集和测试集"""from sklearn.cross_validation import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)"""# 特征缩放from sklearn.preprocessing import StandardScalersc_X = StandardScaler()sc_y = StandardScaler()X = sc_X.fit_transform(X)y = sc_y.fit_transform(y)# 拟合SVR到数据集from sklearn.svm import SVRregressor = SVR(kernel = 'rbf')regressor.fit(X, y)# 预测新结果y_pred = regressor.predict(6.5)y_pred = sc_y.inverse_transform(y_pred)# 可视化SVR结果plt.scatter(X, y, color = 'red')plt.plot(X, regressor.predict(X), color = 'blue')plt.title('真相还是虚张声势 (SVR)')plt.xlabel('职位级别')plt.ylabel('薪水')plt.show()# 可视化SVR结果(更高分辨率和更平滑的曲线)X_grid = np.arange(min(X), max(X), 0.01) # 选择0.01而不是0.1作为步长,因为数据已进行特征缩放X_grid = X_grid.reshape((len(X_grid), 1))plt.scatter(X, y, color = 'red')plt.plot(X_grid, regressor.predict(X_grid), color = 'blue')plt.title('真相还是虚张声势 (SVR)')plt.xlabel('职位级别')plt.ylabel('薪水')plt.show()
现在我对上述代码遇到了如下错误:期望2D数组,但得到的是1D数组:array=[ 45000. 50000. 60000. 80000. 110000. 150000. 200000. 300000. 500000. 1000000.]。请使用array.reshape(-1, 1)重塑你的数据,如果你的数据只有一个特征,或者使用array.reshape(1, -1)如果它包含一个样本。
如果我在应用特征缩放之前对其进行重塑,所有的值都会变成0。
回答:
尝试将你的y
赋值行更改为:
y = dataset.iloc[:, 2:3].values
或者,按照错误消息的建议:
y = dataset.iloc[:, 2].values.reshape(-1, 1)