我有一些关于全天停车位占用率的测量数据。这意味着在夜间,停车位完全被占用。到了中午,占用率并不高。
如果我在X,Y图上展示这些数据,看起来有点像抛物线(-x^2)。X轴是从午夜到晚上11:59的时间,Y轴是空闲停车位的百分比。
哪种模型更适合进行预测?线性回归吗?应该不是,应该是非线性回归,对吗?还是应该选择其他模型?
回答:
数据似乎有明显的分组,这里是手绘的粗略表示。早上有两个组,晚上有两个组,中午有一个组。我的建议是根据一天中的不同时间将数据分成不同的模型:一个用于早晨,一个用于中午,一个用于晚上。如果你有任何方法来区分两个早晨和两个晚上的组,建模效果会大大提高——例如,这些可能是按日付费和按月付费的人群的区别。