我即将学习神经网络的工作原理。让我明确一点:我不想使用任何内置函数。为了我的理解,我想从头开始构建一个自己的感知器。作为一个例子,我根据下面的示意图构建了一个感知器:
除了神经元6和7外,所有神经元都使用恒等函数。这两个神经元应该使用逻辑函数1/(1+e^(-x))。神经元1直接连接到神经元6,神经元2直接连接到输出神经元8。
我的问题是如何实现这种特殊情况。当所有神经元都是恒等函数时,我在C语言中得到了正确的值。但是一旦我想在神经元6和7上实现逻辑函数,我得到的值就不正确了。
是否有可能找到一个通用的算法来覆盖这些特殊情况?(不同的激活函数,跨层连接,反馈)。
我希望它尽可能地通用和数学化。应该避免使用变通方法!
代码如下:
clear;% 输入层o1 = 1;o2 = 1;o3 = 1;% 隐藏层o4 = 0;o5 = 0;o6 = 0;o7 = 0;% 输出层o8 = 0;% 初始化输入向量:O = [o1,o2,o3,o4,o5,o6,o7,o8];C = 0;% 权重矩阵: % 1 2 3 4 5 6 7 8 W = [0,0,0,1,1,1,0,0; % 1 0,0,0,1,1,0,0,1 ; % 2 0,0,0,1,1,0,0,0 ; % 3 0,0,0,0,0,1,1,0 ; % 4 0,0,0,0,0,1,1,0 ; % 5 0,0,0,0,0,0,0,1 ; % 6 0,0,0,0,0,0,0,1 ; % 7 0,0,0,0,0,0,0,0]; % 8% 3层 = 3次迭代:for c = 0:2% 计算输出向量(t+1):A = O*W;% 分配新的输入向量:O = A;% 这似乎不正确:% 我希望除了神经元6和7外,所有神经元都使用恒等函数% 然而,我最终没有得到正确的解O(6) = 1/(1+exp(-O(6)));O(7) = 1/(1+exp(-O(7)));% 整个网络的结果:C = C + Oend
回答:
对于那些感兴趣的人,我自己找到了解决方案:
clear;% 输入层o1 = 0.1;o2 = 0.1;o3 = 0.1;% 隐藏层o4 = 0;o5 = 0;o6 = 0;o7 = 0;% 输出层o8 = 0;Org = [o1,o2,o3,o4,o5,o6,o7,o8];O = Org;C = 0; % 1 2 3 4 5 6 7 8W = [0,0,0,1,1,1,0,0; % 1 0,0,0,1,1,0,0,1 ; % 2 0,0,0,1,1,0,0,0 ; % 3 0,0,0,0,0,1,1,0 ; % 4 0,0,0,0,0,1,1,0 ; % 5 0,0,0,0,0,0,0,1 ; % 6 0,0,0,0,0,0,0,1 ; % 7 0,0,0,0,0,0,0,0]; % 8for c = 0:2 A = O*W; O = A; O(6) = 1/(1+exp(-1*O(6))); O(7) = 1/(1+exp(-1*O(7))); % 这就是解决方案: O = O + Orgend