我正在训练一个视频预测模型。
根据损失图表显示,模型收敛得非常快,但最终损失值不够小,生成效果也不理想。
实际上,我已经测试了lr=1e-04
和lr=1e-05
,损失图表下降得稍微慢了一些,但仍然不理想。不过我认为lr=1e-05
应该已经足够小了,不是吗?
我应该如何调整我的模型或超参数?
回答:
尝试使用不同的学习率。你可能下降速度过快,陷入局部最优解,或者下降速度过慢,始终找不到全局最优解。
在调整你的网络之前,请确保问题不是出在学习率上。祝好运!
我正在训练一个视频预测模型。
根据损失图表显示,模型收敛得非常快,但最终损失值不够小,生成效果也不理想。
实际上,我已经测试了lr=1e-04
和lr=1e-05
,损失图表下降得稍微慢了一些,但仍然不理想。不过我认为lr=1e-05
应该已经足够小了,不是吗?
我应该如何调整我的模型或超参数?
回答:
尝试使用不同的学习率。你可能下降速度过快,陷入局部最优解,或者下降速度过慢,始终找不到全局最优解。
在调整你的网络之前,请确保问题不是出在学习率上。祝好运!