在神经网络的前向传播中,计算权重和输入之间的点积时,哪一种方法在先?方法1)还是方法2)?
1) Weight.dot(Input) + Bias
2) Input.dot(Weight) + Bias
我见过这两种方法。我感到困惑。
回答:
这两种方法的区别在于点积中权重和输入的顺序。然而,点积操作的交换性表明顺序并不重要;无论顺序如何,结果都是相同的。
尽管如此,我最熟悉的是Weight.dot(Input) + Bias
。
从数学的角度来看,你可能会认为Weight.dot(Input)
是首选方法,因为权重被视为系数,因此首先出现最符合逻辑。
从编程的角度来看,这将在很大程度上取决于实现;可能更倾向于在输入对象上调用dot()
方法,而不是在权重上。
请注意,点积与矩阵乘法不同。正如你所指出的,矩阵乘法不一定具有交换性。我主要使用的库Tensorflow,使用tf.matmul()
来实现矩阵乘法。在提供的神经网络实现中,权重总是作为第二个参数使用,这表明在这种情况下,第二种方法可能是首选。