我的训练损失持续下降,但当我的测试准确率超过95%时,它会上下波动。这是否意味着我的模型过拟合了,还是这是正常现象?我应该怎么做?
我的网络大约有7000万个参数。批量大小为16。
这是我的测试和验证损失。我应该怎么做?另外,我的验证损失低于训练损失?这是为什么?
我使用了不同的核大小,并尝试在较少的轮次中运行。也许我应该用更多的轮次来训练网络?
回答:
让我们按顺序回答你的问题。首先关于“准确率上下波动”。这意味着你在训练模型时已经达到了极值点。也就是说,你的模型已经学会了。由于你的指标在验证集上显示出相当高的指标,所以我们可以说模型学得很好(当然,如果指标为任务选择得当的话)。
现在关于“我的验证损失低于训练损失”。这是正常的,因为验证的本质。我建议你研究一下什么是验证集、训练集和测试集。