我正在学习神经网络,这对我来说是最有趣的事情之一。
我的问题是:如何计算拓扑结构任意的神经网络的输出?是否有某种算法或经验法则可以使用?
例如,我理解前馈网络有直接的矩阵表示,但对于有循环或输出连接到输入的网络呢?那些是否有矩阵形式?或者唯一产生输出的方法是进行某种图遍历?
例如:
回答:
-
让我们看一下你问题中附带的神经网络结构图。
人工神经网络的连接不像看起来那样是普通的有向图。这里隐含了额外的限制,比如按层分布的不同类型的节点。
有输入节点、隐藏节点和输出节点。简单来说,输入节点(神经元值)被认为是只读的,不能进行修改。因此,节点9和节点4之间的连接是没有意义的,因为输入4本身不会进一步传播信号。
节点8和节点11之间的连接也是如此。你可以查看这里,神经网络的基础知识以简单的方式进行了解释。 -
谈到有循环的网络,我们假设是递归网络。假设我们有一个如图所示的递归神经网络。
我们如何计算输出?
我们可以尝试应用与前馈网络相同的计算规则。,
, 这里的f 是激活函数。
但是,等一下,我们不是需要知道和
的值吗?技术上,这不是递归。
你可以将其理解为“节点的下一个值依赖于
节点的当前值”。
所示网络的动态可以通过“展开”(如下所示)来可视化。因此,递归网络可以被视为每个时间步一个层的深层网络,并且在时间步之间共享权重。在这里,我们将步骤0的隐藏层视为步骤1的输入。
回到我们的情况,第一步计算的公式应该看起来像。
同样,第二步可以计算为。
为了简化,和
的值可以初始化为零(尽管实际上初始状态是作为模型参数进行训练的)。展开用于训练(技术上,我们只是用一系列前馈隐藏层替换递归网络)。
总之,递归网络仍然有矩阵表示和操作,尽管这看起来并不明显和直接。