当我增加更强的正则化(例如,L2正则化参数从1增加到10,或者dropout参数从0.75降低到0.5)时,我的模型性能变慢且变差(例如,测试准确率在3000-4000次迭代中从97-98%下降到94-95%)。这可能有什么原因吗?我可以确认所有代码都正确实现了。谢谢!
编辑:我想补充说明,我的程序存在大约1%的过拟合现象,并且无论是否使用dropout,训练和测试准确率之间的差异大致相同。
回答:
准确率急剧下降的原因可能是欠拟合。尝试使用小于1的L2正则化值,例如[0.01,0.03,0.1,0.3,0.9],看看效果如何。