我正在尝试使用Delta训练规则来训练一个感知器,以实现AND布尔函数。但即使在收敛后,它仍然错误地分类了输入(实际上是1个输入)。请问我哪里做错了: http://ideone.com/CDgTQE
这是使用的训练函数:
public void trianWithDelta(Example[] examples){ for(int i=0;i<1000;++i){ dw1 = 0; dw2 = 0; for(Example ex:examples){ double o = computeOutput(ex); double t = ex.o; dw1 = dw1 + n*(t-o)*ex.x1; dw2 = dw2 + n*(t-o)*ex.x2; } w1 += dw1; w2 += dw2; } }
训练示例(布尔AND):
Example[] examples = new Example[]{ new Example(-1, -1, -1), new Example(-1 , 1, -1), new Example( 1, -1, -1), new Example( 1, 1, 1) };
结果:w1 : 0.49999999999999994 w2 : 0.5000000000000002
使用训练示例在训练后的测试结果:
-1
1(错误)
-1
1
回答:
你的代码实际上是正确的,问题在于你对无偏见感知器能学到什么和不能学到什么的理解上。
如果你没有偏见,那么学习AND几乎是不可能的,因为:
- 你的数据之间只有一个角度分隔,这个角度对应于线
y=-x
,在你的代码中这意味着w1=w2
,即使它们之间的值有最微小的差异(例如1e-20
)也会破坏分类器 - 你的分类器实际上回答了三个值(因为你使用了符号函数):-1, 0, 1,而在这种设置下,没有偏见是不可能分离AND的,因为你需要在激活为0时回答-1。
试着在纸上画出正确的分隔线,你会注意到,没有偏见的情况下,你的线必须通过(0,0),因此,它必须是y=-x,因此,对于(-1,1)和(1,-1),激活值为0。
这两个问题都可以通过添加偏见节点来解决(这是你应该做的)。
你也可以稍微改变AND的定义——例如,将“False”编码为-2
Example[] examples = new Example[]{ new Example(-2, -2, -2), new Example(-2 , 1, -2), new Example( 1, -2, -2), new Example( 1, 1, 1) };
运行你的代码后,行为符合预期
Trained weights : 0.6363636363636364 0.6363636363636364-1-1-11