在 Jupyter 笔记本中运行 reg.predict 时遇到问题,提示 “ValueError”

正在尝试学习 Python 中的 sklearn,但 Jupyter 笔记本报错显示 “ValueError: Expected 2D array, got scalar array instead:array=750.Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.” 然而,我已经将 x 定义为 2D 数组,使用了 x.values.reshape(-1,1)。

您可以在此处找到 CSV 文件和错误代码的截图 -> https://github.com/CaptainRD/CSV-for-StackOverflow

    import numpy as np    import pandas as pd    import matplotlib.pyplot as plt    import seaborn as sns    sns.set()    from sklearn.linear_model import LinearRegression    data = pd.read_csv('1.02. Multiple linear regression.csv')    data.head()    x = data[['SAT','Rand 1,2,3']]    y = data['GPA']    reg = LinearRegression()    reg.fit(x,y)r2 = reg.score(x,y)    n = x.shape[0]    p = x.shape[1]    adjusted_r2 = 1-(1-r2)*(n-1)/(n-p-1)    adjusted_r2    reg.predict(1750)

回答:

如您在代码中所见,您的 x 包含两个变量,SATRand 1,2,3。这意味着,您需要为 predict 方法提供一个二维输入。例如:

reg.predict([[1750, 1]])

这将返回:

>>> array([1.88])

您遇到这个错误是因为您没有提供第二个值(对于 Rand 1,2,3 变量)。请注意,如果这个变量不重要,您应该将其从 x 数据中移除。

Related Posts

神经网络反向传播代码不工作

我需要编写一个简单的由1个输出节点、1个包含3个节点的…

值错误:y 包含先前未见过的标签:

我使用了 决策树分类器,我想将我的 输入 作为 字符串…

使用不平衡数据集进行特征选择时遇到的问题

我正在使用不平衡数据集(54:38:7%)进行特征选择…

广义随机森林/因果森林在Python上的应用

我在寻找Python上的广义随机森林/因果森林算法,但…

如何用PyTorch仅用标量损失来训练神经网络?

假设我们有一个神经网络,我们希望它能根据输入预测三个值…

什么是RNN中间隐藏状态的良好用途?

我已经以三种不同的方式使用了RNN/LSTM: 多对多…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注