机器学习中测试标签和验证标签有什么区别?

我有一个关于数据集训练和验证的问题。

我理解训练数据标签的概念,即y_train。但我不明白为什么我们的测试/验证样本也需要有标签。我假设给测试样本打上标签,就是在将它们输入算法之前定义它们,对吗?

让我这样说吧,如果我有一组狗和猫的图片数据集,并且分别标记为1和2。那么,如果我想用一张不在训练数据集中的狗的图片来测试我的模型,为什么要给它打标签呢?如果我给它标记为1,那么我事先就告诉它这是一只狗;如果我标记为2,那么它已经是一只猫了。

我可以有一个没有标签的测试/验证数据集吗?


回答:

验证数据集用于微调模型中的参数,而测试集则用于检查准确性。没有标签,如何声称模型的正确性?这个概念在监督学习中是有效的,因此测试和验证数据集需要有标签。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注