验证损失或模型评估

我有一个门控循环单元(GRU)模型,我制作了两个略有不同的版本。当我运行这两个版本时,版本1的验证均方误差(MSE)为0.0013,而版本2的为0.0015。这意味着版本1是更好的模型。但是,当我使用测试数据框运行model.evaluate(X_test,y_test)时,版本1的MSE值为0.0027,而版本2的为0.0018。

我的问题是,哪个版本被认为更好,是验证MSE更好的版本,还是使用测试数据框进行预测时MSE更低的模型?

谢谢你。


回答:

首先,你不能在测试集上作弊,并选择模型以使其在测试上获得最佳结果。验证的目的是用于这个意图,而测试只是为了检查验证和测试是否彼此相符。

你没有提到训练、验证和测试数据集的大小。你使用的数据大小在训练、验证和测试中都需要足够大,以代表数据的真实分布。

另一方面,你抽样数据的方式应该确保这三个集合具有相同的分布。

最后但同样重要的是,你在比较两个结果时,MSE的差异约为0.0002。我认为这不足以让你做出哪个模型更好的判断。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注