我正在尝试重现来自http://neuralnetworksanddeeplearning.com/chap2.html的神经网络。
我不明白的是,为什么他们可以通过将误差/delta与前一层的激活值的转置进行点积来计算权重的梯度下降。
nabla_w[-1] = np.dot(delta, activations[-2].transpose())
delta
是一个一维数组。activations[-2]
也是。我以为如果转置一个一维数组,你得到的仍然是一个一维数组.. 所以这个点积只会得到一个单一的数字,而不是我们想要的矩阵。
那么这个点积如何能给我一个二维矩阵呢?
还有有没有使用numpy计算权重梯度下降的聪明方法?
回答:
计算两个向量(即你的一个维数组)之间的点积,应该返回一个单一的标量(值)。在两个向量之间进行叉积将产生一个新的向量。
因此,它不能产生矩阵。点积不会产生矩阵,只会产生标量。np.dot() 使用两个矩阵作为参数时,会返回矩阵的乘积,但这与点积不同。