我昨天发布了一个问题,内容是关于我的用于 XOR 运算的反向传播神经网络所遇到的问题。我做了一些额外的工作,意识到这可能与没有偏置神经元有关。
我的问题是,一般情况下,偏置神经元的作用是什么?它在识别 XOR 运算的反向传播神经网络中的作用又是什么?是否可以在没有偏置神经元的情况下创建一个神经网络?
回答:
创建没有偏置神经元的神经网络是可能的…它也能正常工作,但想要了解更多信息,我建议你查看此问题的答案:
更新: 偏置神经元在试图解决建模 XOR 的神经网络中的作用是最小化神经网络的大小。通常,对于“原始”(不确定这个术语是否正确)逻辑函数,例如AND
、OR
、NAND
等,您试图创建一个具有 2 个输入神经元、2 个隐藏神经元和 1 个输出神经元的神经网络。这对于XOR
是无法实现的,因为建模 XOR
最简单的方法是使用两个NAND
门:
您可以将A
和B
视为您的输入神经元,中间的门是您的“偏置”神经元,后面的两个门是您的“隐藏”神经元,最后您得到输出神经元。您可以在没有偏置神经元的情况下解决XOR
问题,但这需要您将隐藏神经元的数量增加到至少 3 个隐藏神经元。在这种情况下,第三个神经元本质上充当偏置神经元。这是另一个讨论关于XOR
的偏置神经元的问题:XOR 问题是否可以用没有偏置的 2x2x1 神经网络解决?