我有一个文件,里面包含了从2015年到2019年(截至2019年12月31日)的5年每日数据,我需要预测2021年的每日值;我使用的是statsmodels.tsa.holtwinters.ExponentialSmoothing,到目前为止,我通过预测2019年和2020年的数据来进行预测。是否可以不预测2020年的数据,直接预测2021年的数据?
这是我目前的代码:
fit1 = ExponentialSmoothing(train[colval],seasonal_periods=730,trend=trend, seasonal=seasonal,).fit()prediction_result = fit1.forecast(365)
使用上述代码,预测从训练数据集结束后开始,这是正常的吗?
这是我数据的分割方式:2015-2018年用于训练,2019年用于测试
回答:
如果你在训练时将具有频率设置的基于datetimeindex
的序列输入到ExponentialSmoothing
中,你可以使用predict函数来预测任何日期的数值。AirPassengers数据的频率设置为每月开始。AirPassengers中包含的数据是从1949年到1960年的数据。
请参考下面的示例以获取详细信息:
import pandas as pd df = pd.read_csv('AirPassengers.csv')df['Month'] = pd.to_datetime(df['Month'])df = df.set_index('Month')from statsmodels.tsa.api import ExponentialSmoothinges = ExponentialSmoothing(df).fit()es.predict('2021-05-01', '2021-08-01')
你将得到以下输出:
0 | |
---|---|
2021-05-01 00:00:00 | 431.792 |
2021-06-01 00:00:00 | 431.792 |
2021-07-01 00:00:00 | 431.792 |
2021-08-01 00:00:00 | 431.792 |
希望这能回答你的问题。