我有不同国家和因素的时间序列数据,例如阿富汗从1972年到2007年的出生率数据(来源)。
目标:预测例如2008年和2012年的出生率
我熟悉线性回归,但需要一些关于如何处理时间序列数据并预测未来值的帮助。
您能提供一些例子或分享代码片段吗?
回答:
可以看看statsmodels
的时间序列分析模块。时间序列模型通常基于自相关,该模块包含标准的单变量(适用于单个时间序列)的AR(p)
和MA(p)
模型,以及结合版本的ARIMA
模型,允许处理单位根
。您还可以找到多变量(适用于多个相互关联的时间序列)的VAR
模型。
这里还有一篇关于使用pandas
和statsmodels
进行统计分析和预测的时间序列
教程。