为什么对于识别 XOR 运算的反向传播神经网络来说,偏置神经元是必要的?

我昨天发布了一个问题,内容是关于我的用于 XOR 运算的反向传播神经网络所遇到的问题。我做了一些额外的工作,意识到这可能与没有偏置神经元有关。

我的问题是,一般情况下,偏置神经元的作用是什么?它在识别 XOR 运算的反向传播神经网络中的作用又是什么?是否可以在没有偏置神经元的情况下创建一个神经网络?


回答:

创建没有偏置神经元的神经网络是可能的…它也能正常工作,但想要了解更多信息,我建议你查看此问题的答案:

神经网络中偏置的作用

更新: 偏置神经元在试图解决建模 XOR 的神经网络中的作用是最小化神经网络的大小。通常,对于“原始”(不确定这个术语是否正确)逻辑函数,例如ANDORNAND等,您试图创建一个具有 2 个输入神经元、2 个隐藏神经元和 1 个输出神经元的神经网络。这对于XOR是无法实现的,因为建模 XOR 最简单的方法是使用两个NAND门:

enter image description here

您可以将AB视为您的输入神经元,中间的门是您的“偏置”神经元,后面的两个门是您的“隐藏”神经元,最后您得到输出神经元。您可以在没有偏置神经元的情况下解决XOR问题,但这需要您将隐藏神经元的数量增加到至少 3 个隐藏神经元。在这种情况下,第三个神经元本质上充当偏置神经元。这是另一个讨论关于XOR的偏置神经元的问题:XOR 问题是否可以用没有偏置的 2x2x1 神经网络解决?

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注