我在进行神经网络反向传播编程。我有大约90条数据,用所有数据进行训练(90条数据),并使用相同的数据进行测试(90条数据)。我使用了大约2次迭代的阈值来测试,结果得到了相当大的误差(使用MAPE/平均绝对平方误差大约为60%)。
我担心我的算法可能有问题,因为要使训练误差低于10%的阈值,唯一的方法是使用大约3000k次迭代的阈值,而且训练时间相当长(我没有使用动量。只是一个反向传播神经网络)。但在使用上述条件后,测试准确率在95-99%之间。
这是正常的吗?还是我的程序运作得不太对劲?
回答:
当然,这将取决于所使用的数据集,但我不会惊讶于即使对于高度非线性数据,误差也会低于1%(例如,我在销售数据中见过这种情况)。只要你分开训练和测试数据集,误差预计会上升,但使用相同的数据集,如果有足够的隐藏单元,误差应该会降到零。ANN拟合非线性数据的能力是巨大的(当然,拟合得越多,泛化能力就越差)。
所以,我会查找一些程序错误。