Home IT技术为什么学习率已经很小（1e-05），但模型收敛得太快？

为什么学习率已经很小（1e-05），但模型收敛得太快？

IT技术 xiaolong · 2025年5月23日 · 0 Comment

我正在训练一个视频预测模型。

根据损失图表显示，模型收敛得非常快，但最终损失值不够小，生成效果也不理想。

实际上，我已经测试了lr=1e-04和lr=1e-05，损失图表下降得稍微慢了一些，但仍然不理想。不过我认为lr=1e-05应该已经足够小了，不是吗？

我应该如何调整我的模型或超参数？

回答：

尝试使用不同的学习率。你可能下降速度过快，陷入局部最优解，或者下降速度过慢，始终找不到全局最优解。

在调整你的网络之前，请确保问题不是出在学习率上。祝好运！

computer-vision deep-learning machine-learning

发表回复取消回复