如何在线性回归中使用X和Y变量?

我正在尝试使用简单线性回归来预测某物品的成本。作为输入数据,我使用了该物品的成本。

代码似乎能够正常运行,但我无法理解在应用线性回归时如何使用X和Y。我使用X作为物品成本,Y作为标签(通过移动X的数据创建一个新的行)。

df = df[['Item Price']]forecast_col = 'Item Price'forecast_out = int(math.ceil(0.0000005 * len(df)))df['label'] = df[forecast_col].shift(-forecast_out)X = df[['Item Price']]X = preprocessing.scale(X)X_lately = X[forecast_out:]X = X[:-forecast_out]df.dropna(inplace=True)y = np.array(df['label'])X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)clf = LinearRegression(n_jobs=-1)clf.fit(X_train, y_train)forecast_set = clf.predict(X)

在解决线性回归方程Y = a + bX时,如何使用X和Y变量?


回答:

你的代码行:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

将你的X和y各自分成两个样本:一个包含80%数据的训练集和一个包含其余20%数据的测试集。接着,代码行:

clf = LinearRegression(n_jobs=-1)

创建一个线性模型。最后,通过你的代码行:

clf.fit(X_train, y_train)

线性模型使用X_train和y_train中的所有(x, y)来计算最佳的线性回归器。


从更数学的角度来看,算法使用X_train和y_train中包含的所有(x, y)来寻找最小化方程E的a和b值:

E = SUM(y_i – a*x_i – b)

a和b的值通过找到E的一阶导数和二阶导数等于0的位置来确定。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注