如何根据训练/验证损失和准确率曲线选择最佳模型？

在深度学习中，我们应该根据训练/验证损失和准确率来选择最佳模型，但我如何知道哪个点是最佳的？

是否只依赖于验证准确率而不考虑其他指标？

还有两个相关的问题：

最佳的训练/验证损失和准确率曲线看起来是什么样的？

如果训练损失在减少且训练准确率在增加，但验证损失在增加而验证准确率在长时间训练后停止增加，我该怎么办？

看起来是这样的：

回答：

首先，你需要根据开发/验证数据集的结果来选择模型。因此，验证准确率和验证损失被用来判断模型的性能。

在某种程度上，较高的验证准确率通常与较低的验证损失相关。这是因为你的损失被用来衡量预测结果与真实值之间的差异。

不同的问题使用不同的指标来衡量，就像我们在机器翻译中经常使用BLEU分数一样，你需要阅读一些关于你研究领域的论文来了解哪些指标是流行的。

训练损失减少而验证损失增加在模型训练中是相当常见的现象，这通常意味着你的模型在过拟合。它学到了太多只在训练数据集中出现的特征，而非整个数据集的特征。

至于处理过拟合，有许多方法，如提前停止、丢弃层等。你可以直接在谷歌上搜索这些方法。

学技术