在进行SVM时,传递了一个列向量y而期望的是一维数组错误?

我正在创建一个具有一个自变量X和因变量y的SVM模型。我对数据进行了特征缩放,因为这两个数据变量不在同一尺度上。

现在,当我训练数据集上的模型时,我得到了如下错误:

DataConversionWarning: 传递了一个列向量y,而期望的是一维数组。请将y的形状更改为(n_samples, ),例如使用ravel()。y = column_or_1d(y, warn=True)。

以下是从中得到错误的代码片段:

# 在整个数据集上构建模型from sklearn.svm import SVRregressor = SVR(kernel='rbf')regressor.fit(X,y)

整个文件:

# 导入库import numpy as npimport matplotlib.pyplot as pltimport pandas as pd# 导入数据集dataset = pd.read_csv('Position_Salaries.csv')X = dataset.iloc[:, 1:-1].valuesy = dataset.iloc[:, -1].values# 特征缩放y = y.reshape(len(y), 1)# 特征缩放from sklearn.preprocessing import StandardScalersc_X = StandardScaler()sc_y = StandardScaler()X = sc_X.fit_transform(X)y = sc_y.fit_transform(y)# 在训练数据集上构建模型from sklearn.svm import SVRregressor = SVR(kernel='rbf')regressor.fit(X,y)

我用来训练模型的文件

enter image description here


回答:

你只有一个特征(变量),所以确实需要y = y.reshape(-1, 1)这一行。

# 导入库import numpy as npimport matplotlib.pyplot as pltimport pandas as pd# 导入数据集dataset = pd.read_csv('Position_Salaries.csv')X = dataset.iloc[:, 1:-1].valuesy = dataset.iloc[:, -1].valuesy = y.reshape(-1, 1)# 特征缩放from sklearn.preprocessing import StandardScalersc_X = StandardScaler()sc_y = StandardScaler()X = sc_X.fit_transform(X)y = sc_y.fit_transform(y)# 在训练数据集上构建模型from sklearn.svm import SVRregressor = SVR(kernel='rbf')regressor.fit(X,y)

验证模型是否已拟合:

regressor.get_params(){'C': 1.0, 'cache_size': 200, 'coef0': 0.0, 'degree': 3, 'epsilon': 0.1, 'gamma': 'scale', 'kernel': 'rbf', 'max_iter': -1, 'shrinking': True, 'tol': 0.001, 'verbose': False}

你得到的警告是:

/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/sklearn/utils/validation.py:73: DataConversionWarning: 传递了一个列向量y,而期望的是一维数组。请将y的形状更改为(n_samples, ),例如使用ravel()。 return f(**kwargs)

这是一个DataConversionWarning,意味着算法未能成功收敛。

Related Posts

如何对SVC进行超参数调优?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

如何在初始训练后向模型添加训练数据?

我想在我的scikit-learn模型已经训练完成后再…

使用Google Cloud Function并行运行带有不同用户参数的相同训练作业

我正在寻找一种方法来并行运行带有不同用户参数的相同训练…

加载Keras模型,TypeError: ‘module’ object is not callable

我已经在StackOverflow上搜索并阅读了文档,…

在计算KNN填补方法中特定列中NaN值的”距离平均值”时

当我从头开始实现KNN填补方法来处理缺失数据时,我遇到…

使用巨大的S3 CSV文件或直接从预处理的关系型或NoSQL数据库获取数据的机器学习训练/测试工作

已关闭。此问题需要更多细节或更清晰的说明。目前不接受回…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注