我刚开始学习Python和机器学习。我在网上找到一个同时包含Arduino和Python的项目,于是决定尝试一下。项目的GitHub链接在这里。Arduino部分已经可以正常工作,我已经能够将数据写入CSV文件。我正在尝试将CSV文件中的数据插入到SVM的训练中。然而,我无法通过训练部分。代码如下所示。
import numpy as npimport csvfrom sklearn import svmfrom sklearn.metrics import accuracy_scorefrom sklearn.metrics import confusion_matriximport pandas as pddataframe= pd.read_csv("csvdata.csv", delimiter=',')from sklearn.model_selection import train_test_splittrain, test = train_test_split(df, test_size = 0.2)train_features = train[['LABEL','F1','F2','F3','F4','F5','X','Y','Z','C1','C2']]train_label = train.valuestest_features = test[['LABEL','F1','F2','F3','F4','F5','X','Y','Z','C1','C2']]test_label = test.values## SVMmodel = svm.SVC(kernel='linear', gamma=1, C=1)model.fit(train_features, train_label)
每当我运行代码时,在最后一行就会遇到这个错误:
Traceback (most recent call last): File "C:\Python27\projects\practice\modeling.py", line 32, in <module> model.fit(train_features, train_label) File "C:\Python27\lib\site-packages\sklearn\svm\base.py", line 149, in fit accept_large_sparse=False) File "C:\Python27\lib\site-packages\sklearn\utils\validation.py", line 761, in check_X_y y = column_or_1d(y, warn=True) File "C:\Python27\lib\site-packages\sklearn\utils\validation.py", line 797, in column_or_1d raise ValueError("bad input shape {0}".format(shape))ValueError: bad input shape (11, 11)
我真的很困惑,我不知道该怎么办了。我完全不知道标签和特征以及通过CSV进行训练是如何工作的。我已经研究了通过在Python脚本中手动插入数据进行训练的方法,它们都能工作,但我没有找到通过CSV进行训练的解决方案。
以下是CSV文件的内容
F1,F2,F3,F4,F5,X,Y,Z,C1,C2525, 505, 544, 557, 545, 1268, -8264, 14888, 1, 1523, 505, 544, 557, 545, 1480, -8320, 14684, 1, 1517, 505, 544, 557, 544, 1460, -8352, 14712, 1, 1524, 505, 544, 557, 545, 1436, -8312, 14496, 1, 1568, 506, 544, 557, 544, 1308, -8348, 14744, 1, 1578, 506, 544, 557, 544, 1128, -8484, 14376, 1, 1583, 506, 544, 557, 545, 1376, -8180, 14768, 1, 1583, 505, 544, 557, 545, 1380, -8220, 14636, 1, 1550, 505, 544, 557, 544, 1332, -8376, 14700, 1, 1510, 505, 544, 557, 545, 1412, -8320, 14620, 1, 1510, 505, 544, 557, 545, 1412, -8320, 14620, 1, 1510, 505, 544, 557, 545, 1412, -8320, 14620, 1, 1
希望有人能帮我,已经几周了,我想解决这个问题。谢谢你。
回答:
在你的model.fit
中,你应该传递特征和标签;但目前的设置(train_label = train.values
),你的特征和标签实际上是相同的东西。你的标签应该是1维的(你可以在错误消息中看到y = column_or_1d
),而且绝对不应该是你的特征的一部分。
你应该按以下方式更改特征和标签的定义:
train_features = train[['F1','F2','F3','F4','F5','X','Y','Z','C1','C2']]train_label = train['LABEL']test_features = test[['F1','F2','F3','F4','F5','X','Y','Z','C1','C2']]test_label = test['LABEL']
如果你的model.fit
仍然无法工作,尝试以下方法:
model.fit(train_features.values, train_label.values)