我在Keras中使用tensorflow2后端,通过imagedatagenerator类对批次进行训练。我注意到当第二个epoch开始时,损失值比第一个epoch结束时的值小很多。
我的意思是这样的:
请注意,第二个epoch的起始值大约是你看到的截图中的值。
有谁知道这是为什么吗?
Keras在所有批次处理完后会再次更新权重吗?
回答:
损失值变小是预期之内的,但你对其变化幅度感到惊讶是可以理解的。
第二个epoch的损失值如此低的原因是,在第一个epoch中,你的模型犯了错误,产生了较大的损失——这些损失逐渐改善。Keras显示的是一个epoch中所有实例的平均损失。
因此,如果模型在第一个epoch的前90%训练集中犯了错误,而在最后10%的数据上表现完美,损失仍然会很大,因为这是平均损失。
然后,在第二个epoch开始时,模型已经能够更好地进行预测,因此平均损失更低了。