训练误差和测试误差之间的微小差距，是否意味着过拟合？

我正在处理一个包含368609个样本和34个特征的数据集，我希望使用Keras中的神经网络来预测延迟（真实值），模型有3个隐藏层，每层有1024个神经元，我在每个隐藏层使用了50%的dropout和0.001的L2正则化。问题是我得到的测试平均绝对误差为3.5505毫秒，训练平均绝对误差为3.4528毫秒。这里，训练误差比测试误差小一个微小的差距，这是否意味着我们这里存在过拟合问题？

回答：

不完全是，但查看你的模型对新数据的泛化情况总是好的做法。

保留原始数据集的10%-20%作为测试集，并尝试预测测试集中每条记录的输出。

有时候，当我们多次尝试改进模型时，处理相同的验证集，我们也会倾向于过拟合评估数据集。

通常，拥有用于训练、评估和测试的三个不同数据集可以全面解决过拟合问题。

学技术

训练误差和测试误差之间的微小差距，是否意味着过拟合？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复