在深度学习中,我们应该根据训练/验证损失和准确率来选择最佳模型,但我如何知道哪个点是最佳的?
是否只依赖于验证准确率而不考虑其他指标?
还有两个相关的问题:
最佳的训练/验证损失和准确率曲线看起来是什么样的?
如果训练损失在减少且训练准确率在增加,但验证损失在增加而验证准确率在长时间训练后停止增加,我该怎么办?
看起来是这样的:
回答:
首先,你需要根据开发/验证数据集的结果来选择模型。因此,验证准确率和验证损失被用来判断模型的性能。
在某种程度上,较高的验证准确率通常与较低的验证损失相关。这是因为你的损失被用来衡量预测结果与真实值之间的差异。
不同的问题使用不同的指标来衡量,就像我们在机器翻译中经常使用BLEU分数一样,你需要阅读一些关于你研究领域的论文来了解哪些指标是流行的。
训练损失减少而验证损失增加在模型训练中是相当常见的现象,这通常意味着你的模型在过拟合。它学到了太多只在训练数据集中出现的特征,而非整个数据集的特征。
至于处理过拟合,有许多方法,如提前停止、丢弃层等。你可以直接在谷歌上搜索这些方法。