我正在尝试使用SVM来预测某一特定一维数据的未来值。该数据包含54个月的销售数值及其对应的月份索引,从1到54。第一个问题是我认为SVM可以进行预测,但我对此并不是很确定。据我所知,SVM可以进行分类,但对于回归呢?谁能告诉我SVM为何可以进行回归?
在我的问题中,我尝试将月份索引设置为X,将每个月的数值设置为y。我不太确定这样做是否正确,因为没有标签(或者我尝试使用数值作为标签),特征只有月份索引。
我尝试使用from sklearn import svm
进行拟合,结果发现训练集的准确率为100%,而测试集的准确率为0。我不知道哪里出了问题。
这是代码:
import pandas as pdimport numpy as npdf = pd.read_csv('11.csv', header=None, names = ['a', 'b', 'c'])X = df['b'].values.reshape(-1,1)y = df['c'].values.reshape(-1,1)from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)from sklearn import svmclf = svm.SVC(C=0.8, kernel='rbf', gamma=20, decision_function_shape='ovr')clf.fit(X_train, y_train.ravel())print("training result:",clf.score(X_train, y_train))print("testing result:",clf.score(X_test,y_test))
数据集看起来像这样 X = [1, 2, 3, 4,…,53, 54] 和 y = [90, 18, 65, 150…. 289],是一维数据集。
回答:
用于回归的SVM称为支持向量回归(SVR),在sklearn模块中可用。
你需要使用svm.SVR()
而不是svm.SVC()
,并设置适当的参数。是的,一维数据应该没问题。