为什么更多的训练轮次会使我的模型变差？

我的大部分代码基于这篇文章，我要问的问题在这篇文章中也很明显，并且在我的测试中也有体现。这是一个包含LSTM层的序列模型。

这是用大约20个小数据集训练了一个epoch的模型，对真实数据的预测图。

这是另一个图，但这次是用更多数据训练了10个epoch的模型。

是什么导致了这种情况，我该如何解决？另外，我发送的第一个链接在底部也显示了相同的结果——1个epoch效果很好，而3500个epoch效果很差。

此外，当我用更高的数据量进行训练，但只运行1个epoch时，得到的结果与第二个图相同。

是什么可能导致这个问题？

回答：

几个问题：

酷炫的图表

早期的图表确实看起来很有趣，但仔细观察它：

我清楚地看到预测的谷底在预期数据应该达到峰值的地方

这真的更好吗？这听起来像是一个完全不同步的随机波动，这意味着一条直线实际上比这代表更好的损失值。

仔细看看“训练损失”，这可以确切地告诉你你的模型是否更好。

如果情况是这样，并且你的模型未达到预期的输出，那么你可能需要构建一个更有能力的模型（更多的层，更多的单元，不同的方法等）。但要注意，许多数据集过于随机，无法学习，无论模型有多好。

如果你实际上有更好的训练损失。好的，那么你的模型确实是在改善。

如果你的“验证”损失在变差，那么你的模型就在过拟合。它是在记忆训练数据而不是在学习一般规律。你需要一个能力较弱的模型，或者大量的“dropout”。

通常，存在一个最佳点，即验证损失停止下降，而训练损失继续下降。如果你过拟合，这是停止训练的点。阅读keras文档中的EarlyStopping回调函数的说明。

如果你的训练损失在上升，那么你就遇到了真正的问题，要么是bug，要么是某个地方的计算准备不当（如果你使用的是自定义层），要么就是学习率太大。

降低学习率（除以10或100），创建并编译一个“新”模型，然后重新开始训练。

那么你需要详细说明你的问题。