我使用PyBrain创建了一个简单的卷积神经网络:
from pybrain.tools.shortcuts import buildNetworkfrom pybrain.datasets import SupervisedDataSetfrom pybrain.supervised.trainers import BackpropTrainer L_Z = [ 0b111111, 0b000010, 0b000100, 0b001000, 0b010000, 0b111111 ]C_Z = [ 0b111111, 0b100001, 0b000110, 0b000001, 0b100001, 0b111111 ]net = buildNetwork(6, 3, 1)ds = SupervisedDataSet(6, 1)ds.addSample(tuple(L_Z), (1,))ds.addSample(tuple(C_Z), (0,))trainer = BackpropTrainer(net, ds)trainer.trainUntilConvergence()print net.activate(L_Z)print net.activate(C_Z)
但每次运行程序后显示的结果都不同。我的网络应该学会识别英文字母’Z’和西里尔字母’З’。哪里出了问题?
回答:
你的方法从根本上是错误的。拥有6个输入的神经网络意味着每个输入是一个可以从0到1的浮点数。PyBrain不会告诉你当你提供的值过高或过低时。举个例子,0b111111实际上是63。如果你想要每个检测单元有一个输入,你需要使用一个有36个输入的神经网络。
L_Z = [ 1,1,1,1,1,1, 0,0,0,0,1,0, 0,0,0,1,0,0, 0,0,1,0,0,0, 0,1,0,0,0,0, 1,1,1,1,1,1 ] C_Z = [ 1,1,1,1,1,1, 1,0,0,0,0,1, 0,0,0,1,1,0, 0,0,0,0,0,1, 1,0,0,0,0,1, 1,1,1,1,1,1 ] net = buildNetwork(36, 3, 1) ds = SupervisedDataSet(36, 1) ds.addSample(L_Z, [1]) ds.addSample(C_Z, [0]) trainer = BackpropTrainer(net, ds) for x in range(1000): trainer.train() print net.activate(L_Z) print net.activate(C_Z)
我很惊讶.trainUntilConvergeance() 居然能工作,通常它会将四分之一的数据留作验证,如果你只给它两个例子,它通常会崩溃。无论如何,这段代码可以实现你想要的结果,但如果你试图进行计算机视觉,通常他们会使用多种方法的组合来进行检测。