我正在尝试一个非常简单的例子,使用一个名为pyBrain的Python库,但我无法让它正常工作。 很可能有一个非常简单的原因,所以,我希望有人能帮助我!
1) 一个简单的异或运算可以正常工作。
2) 将数字时钟上显示的LED分类到数值输出值可以正常工作。
例如:
[ 1. 1. 1. 0. 1. 1. 1.] => [ 0.]
[ 0. 0. 1. 0. 0. 1. 0.] => [ 1.]
[ 1. 0. 1. 1. 1. 0. 1.] => [ 2.]
[ 1. 0. 1. 1. 0. 1. 1.] => [ 3.]
[ 0. 1. 1. 1. 0. 1. 0.] => [ 4.]
[ 1. 1. 0. 1. 0. 1. 1.] => [ 5.]
[ 1. 1. 0. 1. 1. 1. 1.] => [ 6.]
[ 1. 0. 1. 0. 0. 1. 0.] => [ 7.]
[ 1. 1. 1. 1. 1. 1. 1.] => [ 8.]
[ 1. 1. 1. 1. 0. 1. 1.] => [ 9.]
3) 将数值分类到LED输出以驱动数字显示不起作用。
例如:
[ 0.] => [ 1. 1. 1. 0. 1. 1. 1.]
等等(如上,但反过来)。
我使用一个简单的线性激活器,有10个输入,1个输出,并且我尝试了隐藏层中超过12个神经元。
我的困惑是,网络不应该能够在隐藏层中用10个神经元记住模式吗?
我相信我错过了一些显而易见的东西,所以,请随时启发我的愚蠢!
回答:
当您进行回归(表示一系列值的单个输出节点)时,线性激活是合适的,但对于分类(表示匹配的二进制输出),最好使用限制值范围的激活,例如 sigmoid 或 tanh。