预测销售数量是回归问题还是分类问题?

我是一名机器学习初学者,目前正在Coursera上学习Andrew Ng的机器学习课程。在讲座中,他提出了一个简单的问题:你会将以下情况称为分类问题还是回归问题?

你有一大批相同的商品。你想预测在接下来的三个月内这些商品的销售数量。

我选择了分类,因为我认为我们只是在预测会卖出(1)还是不会卖出(0)。但他说这是回归问题,因为有成千上万的相同商品,并且这是一个连续的输出。我不明白为什么这是连续的输出。在我看来,这是一个具有成千上万个值的离散输出。能有人解释一下吗?


回答:

我不明白为什么这是连续的输出。在我看来,这是一个具有成千上万个值的离散输出。

这里的连续输出并不是严格的数学意义上的连续;严格来说,你是对的,你的输出(某个整数值)是离散的,但在这种情况下,这不是重点。

使这个问题成为回归问题而不是分类问题的关键区别在于,在分类中,输出被限制为一些(通常是少数预定义的值/级别;很容易看出,这里的情况并非如此,因为销售的数量原则上可以是任何(整数)值,并且将18和19视为不同的类别完全没有意义。

从另一个角度来看,将分类输出视为类别可能会有所帮助,这些类别之间通常没有顺序关系;从这个角度来看,18和19之间的差异可以被视为与18和856之间的差异相同(它们只是不同的类别);直观地讲,既然我们对销售的具体数量感兴趣,这些差异显然是不同的,我们宁愿将“18”误预测为“19”,也不愿误预测为“856”…

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注