我被分配了一个任务,需要根据一些变量来预测餐馆的收入。我可以使用逻辑回归来预测收入数据吗?数据集来自Kaggle的餐馆收入预测项目。附注:我被告知要使用逻辑回归,我知道这不是解决这个问题的正确算法
回答:
是的… 你可以使用!
使用逻辑回归可以对数值变量进行预测。你目前拥有的数据包含所有独立变量,结果将是一个二分变量(依赖变量,值为TRUE/1或FALSE/0)。
然后,你可以使用它来确定对数比率,从而找到一个概率(范围0-1)。
作为参考,你可以查看这个。
——————-更新——————————-
让我给你举个我去年的工作例子… 我们需要预测一个学生是否能通过校园招聘,基于过去三年的测试结果和他们的最终成功或失败的历史数据。(注意:这是二分的,我们稍后会讨论这一点。)
样本数据包括学生的学术成绩和在学校举行的 aptitude 测试成绩,以及他们的状态是已被录用还是未被录用。
但在你的情况下,你需要预测收入(这不是二分的)。那该怎么办呢?看起来我的情况很简单,对吗?不…!
我们不仅仅是被要求预测学生是否会通过,我们是要预测每个学生被录用的几率,这根本不是二分的。看起来和你的情景很像,对吗?
所以,你可以做的就是,首先对数据进行分类,确定哪些输入变量会影响最终的输出变量(这将有助于收入计算)。
例如:使用数据来找出餐馆是盈利还是亏损,然后与一些算法结合来找出近似的收入预测。
我不确定是否已经存在完全符合你需求的算法,但我相信如果你在这方面投入更多的研究和分析,你会做得更好。
提示:永远不要这样想:“逻辑回归能解决我的问题吗?”而是扩展到,“如果与其他技术结合使用,逻辑回归能做得更好吗?”