我在尝试将梯度下降应用于一个简单的线性回归模型时,当绘制二维图形时得到了预期的结果,但当我切换到等高线图时却没有得到预期的图形,我想知道我的错误在哪里。
这是代码:
def J(b_0, b_1, x, y): return (1/len(y))*(y - b_0 - b_1*x)**2def dJ_1(b_0, b_1, x, y): return (2/len(y))*np.sum(x*(b_1*x + b_0 - y))def dJ_0(b_0, b_1, x, y): return (2/100)*np.sum((b_1*x + b_0 - y))x = np.linspace(-1, 1, 100)y = np.linspace(-2, 2, 100)b_0 = 5b_1 = 5parameters_0 = [b_0]parameters_1 = [b_1]for i in range(99): b_1 -= 0.1*dJ_1(b_0, b_1, x, y) b_0 -= 0.1*dJ_0(b_0, b_1, x, y) parameters_0.append(b_0) parameters_1.append(b_1)plt.figure(figsize=(4, 8))plt.plot(np.linspace(-2, 7, 100), J(np.linspace(-2, 7, 100), parameters_1[-1], -1, -2))plt.plot(np.array(parameters_0), J(np.array(parameters_0), parameters_1[-1], -1, -2), color="C1")plt.plot(np.array(parameters_0), J(np.array(parameters_0), parameters_1[-1], -1, -2), '-o', color="C1")plt.xlabel(r"$\beta_0$")plt.ylabel(r"$J(\beta_0)$")plt.show()
第一个图:
plt.figure(figsize=(4, 8))plt.plot(np.linspace(-4, 7, 100), J(parameters_0[-1], np.linspace(-4, 7, 100), -1, -2))plt.plot(np.array(parameters_1), J(parameters_0[-1], np.array(parameters_1), -1, -2), color="C1")plt.plot(np.array(parameters_1), J(parameters_0[-1], np.array(parameters_1), -1, -2), '-o', color="C1")plt.xlabel(r"$\beta_1$")plt.ylabel(r"$J(\beta_1)$")plt.show()
第二个图:
b_0 = np.linspace(-10, 10, 100)b_1 = np.linspace(-10, 10, 100)X, Y = np.meshgrid(b_0, b_1)Z = J(X, Y, x=-1, y=-2)fig,ax=plt.subplots(1,1)cp = ax.contourf(X, Y, Z)fig.colorbar(cp) ax.set_xlabel(r"$\beta_0$")ax.set_ylabel(r"$\beta_1$")plt.show()
等高线图是:
为什么我得到上面的图形而不是像下面这样的图形,例如当成本函数的全局最小值在(0, 2)时?提前感谢。
回答:
我认为这里没有错误,你可以从二维图中看到你的梯度下降图是一个二次函数,因此你从等高线图中看到的就像是从天空俯瞰山谷。至于为什么它看起来不像一个圆形,嗯,这是因为它只是一个三维的二次函数。我也曾经做过类似的事情,梯度下降图就像你绘制的那样。查看这里页面末尾的内容