感知器训练的Delta训练规则

我正在尝试使用Delta训练规则来训练一个感知器,以实现AND布尔函数。但即使在收敛后,它仍然错误地分类了输入(实际上是1个输入)。请问我哪里做错了: http://ideone.com/CDgTQE

这是使用的训练函数:

public void trianWithDelta(Example[] examples){     for(int i=0;i<1000;++i){        dw1 = 0;        dw2 = 0;        for(Example ex:examples){            double o = computeOutput(ex);            double t = ex.o;            dw1 = dw1 + n*(t-o)*ex.x1;            dw2 = dw2 + n*(t-o)*ex.x2;        }         w1 += dw1;        w2 += dw2;     }        }

训练示例(布尔AND):

Example[] examples = new Example[]{        new Example(-1, -1, -1),        new Example(-1 , 1, -1),        new Example( 1, -1, -1),        new Example( 1,  1, 1)    };

结果:w1 : 0.49999999999999994 w2 : 0.5000000000000002

使用训练示例在训练后的测试结果:

-1

1(错误)

-1

1


回答:

你的代码实际上是正确的,问题在于你对无偏见感知器能学到什么和不能学到什么的理解上。

如果你没有偏见,那么学习AND几乎是不可能的,因为:

  • 你的数据之间只有一个角度分隔,这个角度对应于线y=-x,在你的代码中这意味着w1=w2,即使它们之间的值有最微小的差异(例如1e-20)也会破坏分类器
  • 你的分类器实际上回答了三个值(因为你使用了符号函数):-1, 0, 1,而在这种设置下,没有偏见是不可能分离AND的,因为你需要在激活为0时回答-1。

试着在纸上画出正确的分隔线,你会注意到,没有偏见的情况下,你的线必须通过(0,0),因此,它必须是y=-x,因此,对于(-1,1)和(1,-1),激活值为0。

enter image description here

这两个问题都可以通过添加偏见节点来解决(这是你应该做的)。

enter image description here

你也可以稍微改变AND的定义——例如,将“False”编码为-2

Example[] examples = new Example[]{        new Example(-2, -2, -2),        new Example(-2 , 1, -2),        new Example( 1, -2, -2),        new Example( 1,  1, 1)    };

enter image description here

运行你的代码后,行为符合预期

Trained weights : 0.6363636363636364 0.6363636363636364-1-1-11

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注