我在尝试使用梯度下降法进行简单线性回归时遇到了问题,但我在这里卡住了
我得到了一个ValueError错误
ValueError: 无法转换为Series,长度必须为1:给定506有人能帮我找出这段代码的问题吗
X_train_std: X的标准化值,X.shape = (506, 13) X包含整数值y.shape = (506,1)
class LinearRegressionGD(object): def __init__(self, eta = 0.001, n_iter = 20): self.eta = eta self.n_iter = n_iter def fit(self, X_train_std, y): self.w_ = np.zeros(1+X_train_std.shape[1]) self.cost = [] for i in range(self.n_iter): output = self.net_input(X_train_std) errors = (y - output) self.w_[1:] += self.eta * X_train_std.T.dot(errors) self.w_[0] += self.eta * errors.sum() cost = (errors**2).sum() /2.0 self.cost_.append(cost) return self def net_input(self,X_train_std): return np.dot(X_train_std, self.w_[1:]) + self.w_[0] def predict(self, X_train_std): return self.net_input(X_train_std)lr = LinearRegressionGD()lr.fit(X_train_std, y)--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-24-29cc349fb131> in <module>() 1 lr = LinearRegressionGD() ----> 2 lr.fit(X_train_std, y) 3 frames /usr/local/lib/python3.6/dist-packages/pandas/core/ops/__init__.py in to_series(right) 637 if len(left.columns) != len(right): 638 raise ValueError( --> 639 msg.format(req_len=len(left.columns), given_len=len(right)) 640 ) 641 right = left._constructor_sliced(right, index=left.columns)
回答:
output
是一维的,而 y
是二维的。这就是为什么你需要重塑 output
的形状。
output = self.net_input(X_train_std).reshape(-1, 1)
另外,我发现你的权重更新没有收敛。如果你用以下代码替换它
self.w_[1:] += self.eta * np.sum(errors * X_train_std, axis=0)
并可能调整学习率,应该可以正常工作。