假设我有一个这样的数据集:
[ [0, 0], [0, 1] [0, 1], [1, 0] [1, 0], [1, 0] [1, 1], [0, 1] ]
实际上,y1 = x1 XOR x2,而y2 = not(x1 XOR x2),这看起来并不奇怪。
使用维基百科提供的代码,该代码是用Python编写的,训练误差似乎无法收敛。
为什么会发生这种情况?这个数据集是否无法用(2, 2, 2)的BP网络进行训练?(2, 2, 2)表示输入层节点数、隐藏层节点数和输出层节点数均为2(偏置节点除外)。
还是代码本身有问题?
回答:
(2,2,2)的神经网络可以轻松地为此进行训练。我刚刚在Encog中尝试过,训练时间与单输出版本相同。实际上,你上面配置的网络是一个一对多分类网络。也就是说,你为每个预期值设置了一个输出神经元。
我对Python不是很熟练,但我猜测问题可能出在代码的调整上。这不是人工神经网络本身的固有限制。