我目前正在实现一个使用dropout的神经网络。一个出现的问题是何时停止训练。
通常我会使用提前停止来确定这一点,但在原始的dropout论文中提到“dropout允许训练更大的网络,并且无需提前停止。”
如果他们不使用提前停止,他们使用什么停止程序呢?
回答:
提前停止是指一旦你获得足够好的结果,或者一段时间内不再看到显著改善,就停止训练的某种方案。
他们的停止程序只是“运行训练x
次迭代/轮次”。
我目前正在实现一个使用dropout的神经网络。一个出现的问题是何时停止训练。
通常我会使用提前停止来确定这一点,但在原始的dropout论文中提到“dropout允许训练更大的网络,并且无需提前停止。”
如果他们不使用提前停止,他们使用什么停止程序呢?
回答:
提前停止是指一旦你获得足够好的结果,或者一段时间内不再看到显著改善,就停止训练的某种方案。
他们的停止程序只是“运行训练x
次迭代/轮次”。