我在处理波士顿房价数据集的回归模型时遇到了一个问题,当我在梯度下降算法中尝试减去两个506×1的矩阵时(prediction_error = np.subtract(y,prediction_function)),结果却得到了一个506×506的矩阵(prediction_error)。我之前做过两次同样的操作,没有出现任何问题。我尝试使用np.subtract代替Python中的常规减号,但情况没有改变。有人能帮帮我吗?
theta_grad = np.zeros((14,1))
print(theta_grad.shape) #调试
prediction_function = X @ theta_grad
print(prediction_function.shape) #调试
prediction_error = np.subtract(y,prediction_function.reshape(y.shape))
print(prediction_error.shape) #调试
gradient = X.T @ prediction_error
回答:
你的数组y
的形状是(506,)
,而另一个数组的形状是(506,1)
,Python会对它们进行广播操作。尝试将它们调整为相似的形状,像这样:
np.subtract(y,prediction_function.reshape(y.shape))
为了更好地理解效果,这里有一个示例代码:
A = np.arange(5) #形状 (5,)
B = np.arange(5).reshape(5,1) #形状 (5,1)
np.subtract(A, B)
[[ 0 1 2 3 4]
[-1 0 1 2 3]
[-2 -1 0 1 2]
[-3 -2 -1 0 1]
[-4 -3 -2 -1 0]]
np.subtract(A, B.reshape(A.shape))
[[0 0 0 0 0]]