我的目标是使用神经网络解决异或问题。我已经阅读了无数关于多层神经网络的理论、证明和数学方面的文章。理论上是说得通的(数学方面……就不那么容易理解了),但我对于神经网络的评估和拓扑有一些简单的问题。
我感觉自己离解决这个问题已经很近了,但我开始质疑我的拓扑和评估技术。撇开反向传播的复杂性不谈,我只想知道我的评估方法是否正确。考虑到这一点,以下是我的问题:
-
假设我们有多个输入,每个输入是否都有自己的节点?我们是否曾经将两个值输入到一个节点中?输入这些信息的顺序是否重要?
-
在评估图形输出时,每个节点是否在接收到值后立即激活?还是我们应该先收集上一层的全部值,然后在消耗所有输入后再激活?
-
评估的顺序是否重要?例如,如果“b”层中的某个节点已经准备好激活——但同一层中的其他节点仍在等待输入——这个准备好的节点是否应该立即激活?还是应该在所有节点都加载完毕后再激活?
-
每一层是否应该连接到下一层的所有节点?
我附上了一张图片,应该有助于解释(部分)我的问题。
感谢您的宝贵时间!
回答:
1) 是的,每个输入都有自己的节点,并且该节点始终是该输入类型的节点。顺序并不重要——您只需要保持一致即可。毕竟,一个未经训练的神经网络可以学会将任何一组线性可分的输入映射到输出,因此不存在需要将节点按特定顺序排列才能使其工作的情况。
2和3) 您需要在下一层的任何节点激活之前,收集来自单一层的所有值。如果您使用的是非逐步激活函数,这一点非常重要,因为输入的总和会影响向前传播的值。因此,您需要在传播任何东西之前知道这个总和是多少。
4) 哪些节点连接到哪些其他节点取决于您。由于您的网络不会过大,而且异或是相当简单的问题,对于您来说,将一层中的所有节点连接到下一层的所有节点(即全连接神经网络)可能是最简单的。对于其他问题,可能会有特殊情况不使用这种拓扑,但没有简单的方法来确定(大多数人使用试错法或遗传算法,如NEAT),而且您不需要为此问题担心这一点。