Home IT技术在神经网络中，为什么偏置被视为一个“b”参数或作为一个额外的“wx”神经元？

在神经网络中，为什么偏置被视为一个“b”参数或作为一个额外的“wx”神经元？

IT技术 xiaolong · 2025年4月7日 · 0 Comment

换句话说，将偏置从b_j切换到神经元求和公式中的额外w_ij*x_i之前的主要原因是什么？是性能吗？哪种方法最好，为什么？

注意：j是当前层的某个神经元，i是较低层的某个神经元。

回答：

注意：在这里询问最佳方法几乎没有意义。这两种方法只是对同一事物的不同数学表示法。

然而，将偏置视为另一个权重，可以将求和重写为观测特征向量x_d与权重向量w的标量乘积。

你是否尝试过计算关于w的导数，以便根据最小二乘法获得最优的w？你会发现这种计算在向量化表示中会变得更加简洁。

除此之外：在许多高级编程语言中，向量化计算比非向量化计算效率高得多。因此，性能也是一个考虑点，至少在某些语言中是这样。

backpropagation machine-learning neural-network

发表回复取消回复