我正在创建一个具有一个自变量X和因变量y的SVM模型。我对数据进行了特征缩放,因为这两个数据变量不在同一尺度上。
现在,当我训练数据集上的模型时,我得到了如下错误:
DataConversionWarning: 传递了一个列向量y,而期望的是一维数组。请将y的形状更改为(n_samples, ),例如使用ravel()。y = column_or_1d(y, warn=True)。
以下是从中得到错误的代码片段:
# 在整个数据集上构建模型from sklearn.svm import SVRregressor = SVR(kernel='rbf')regressor.fit(X,y)
整个文件:
# 导入库import numpy as npimport matplotlib.pyplot as pltimport pandas as pd# 导入数据集dataset = pd.read_csv('Position_Salaries.csv')X = dataset.iloc[:, 1:-1].valuesy = dataset.iloc[:, -1].values# 特征缩放y = y.reshape(len(y), 1)# 特征缩放from sklearn.preprocessing import StandardScalersc_X = StandardScaler()sc_y = StandardScaler()X = sc_X.fit_transform(X)y = sc_y.fit_transform(y)# 在训练数据集上构建模型from sklearn.svm import SVRregressor = SVR(kernel='rbf')regressor.fit(X,y)
我用来训练模型的文件
回答:
你只有一个特征(变量),所以确实需要y = y.reshape(-1, 1)
这一行。
# 导入库import numpy as npimport matplotlib.pyplot as pltimport pandas as pd# 导入数据集dataset = pd.read_csv('Position_Salaries.csv')X = dataset.iloc[:, 1:-1].valuesy = dataset.iloc[:, -1].valuesy = y.reshape(-1, 1)# 特征缩放from sklearn.preprocessing import StandardScalersc_X = StandardScaler()sc_y = StandardScaler()X = sc_X.fit_transform(X)y = sc_y.fit_transform(y)# 在训练数据集上构建模型from sklearn.svm import SVRregressor = SVR(kernel='rbf')regressor.fit(X,y)
验证模型是否已拟合:
regressor.get_params(){'C': 1.0, 'cache_size': 200, 'coef0': 0.0, 'degree': 3, 'epsilon': 0.1, 'gamma': 'scale', 'kernel': 'rbf', 'max_iter': -1, 'shrinking': True, 'tol': 0.001, 'verbose': False}
你得到的警告是:
/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/sklearn/utils/validation.py:73: DataConversionWarning: 传递了一个列向量y,而期望的是一维数组。请将y的形状更改为(n_samples, ),例如使用ravel()。 return f(**kwargs)
这是一个DataConversionWarning
,意味着算法未能成功收敛。