我在学习机器学习中的神经网络时发现,当我计算AND/OR/NOT等布尔函数的激活函数时,并不需要隐藏层
,但对于XOR/XNOR等布尔函数则需要隐藏层
来计算激活函数。这是为什么呢?(我在谷歌上搜索过这个问题,但没有找到清晰的答案)。隐藏层的神经元数量
是否依赖于输入神经元的数量?
回答:
简单来说,隐藏层增加了对输入的额外变换,这种变换在单层网络中不容易实现(实现这种变换的一种方法是向输入添加某种非线性)。第二层增加了额外的变换,可以适应更复杂的任务。关于AND/OR/NOT,它们被认为是线性可分的任务。看看这张图,它显示了AND的值(三个点代表假)。可以用一条线将真值和假值分开,这可以通过没有隐藏层的神经网络来实现。但对于XOR/XNOR,你需要两条线,而这两条线可以通过具有两层和非线性激活函数的神经网络来构建。黄色线条显示了可以用神经网络实现的分离。