我试图使用SciKit Learn的线性回归来分析一个数据集。我的数据集是一个包含数据和标签行的csv文件。我的代码如下:
import numpy as npimport pandas as pdfrom sklearn import linear_modeldata = pd.read_csv('temp.csv')reg = linear_model.LinearRegression()reg.fit(data)
当我运行这段代码时,我得到了错误:TypeError: fit() missing 1 required positional argument: 'y'
遇到此错误的其他程序员通常是没有正确初始化模型(通过省略默认构造函数的括号),然而我已经使用了括号,并且我的初始化语句直接来自于sklearn的示例。因此,我不太确定哪里出了问题。
虽然我过去已经做了相当多的机器学习模型工作,但我一直使用TensorFlow。现在我正在与一个使用SciKit Learn的团队合作,但我在使用它方面的经验不足,这可能是一个我忽略的非常简单的错误!
回答:
LinearRegression
是一种监督学习方法。因此,在尝试拟合模型时,你必须提供y
标签。所以在你的temp.csv
文件中,你应该有一个列代表数据集的y
值。
如果你的y标签只有一列,代码应该像这样:
data = pd.read_csv('filename.csv')x = data[:,:-1]y = data[:,-1]regressor = linear_model.LinearRegression()regressor.fit(x,y)