当我开发一个单隐藏层反向传播神经网络的小型原型,使用Sigmoid激活函数时,我已经从使用非常基本的数据和输出进行训练,过渡到想要训练著名的Iris数据集。
(http://archive.ics.uci.edu/ml/datasets/Iris)
这个数据集有3个输出,并且已经被整合进许多示例神经网络实现中,几乎作为其有效性的证明。4个输入,1×6的隐藏层,3个输出(几乎可以被解读为它属于三种物种之一的概率)。
当我尝试用这个数据集进行训练时,总输出误差波动很大,无论是1000次还是50000次迭代都是如此。
我可以将此视为需要添加另一个隐藏层的指示吗?
回答:
简而言之 – 不需要。Iris数据集几乎是线性可分的,你不需要任何额外的隐藏层就能解决它(几乎达到100%的准确率)。