我有一个看起来像这样的数据框:
2015 2016 2017 2018 2019 Jan 10991273 15761628 20702648 28836397 32462658Feb 11910590 18407640 21867727 29592821 34120748Mar 14720817 22353179 28631090 37017871 41731600Apr 14240928 22383817 28698805 36719286 40352427May 13999937 22562954 30105567 38492879 42443240Jun 14618367 23485559 31294015 40219835 42243535Jul 16954514 22816656 31235203 39633588 41259052Aug 16384802 22418011 30851292 39153646 38739977Sep 17546431 22387746 30207602 37501028 37273751Oct 19069836 24623265 34346016 42694615 0Nov 15864435 21323086 30132954 34682955 0Dec 14728914 18795856 26990426 33064396 0
我基本上是想预测那些零值。
输出结果是这样的:
array([31915988.349427 , 42517368.34239061, 42188302.01643895, 40885793.12471981, 39423851.45561062, 43649973.20909937, 29415292.34136068, 28706985.92182099, 21561488.69575803, 24801192.93635751, -508990.40716472, 6069742.01418072])
这个输出是否代表对这些值的预测?
回答:
我认为这不是。
与一月至九月的早期值不一致是一个不好的迹象。
十一月的大负值表明有些地方出了问题。这些数字代表什么?负值在物理上可能吗?
将函数视为黑盒子是错误的。
我可以从不同的角度来看待这些数据:
- 每个月进行一次拟合,其中年份作为输入值。
- 每年进行一次拟合,总共有12个值。
- 一个以月份和年份为参数的二维曲面。
您在做哪一种?您假设的是哪种阶的拟合?
您应该能够计算SSE并确定不同方案的拟合优度。
我建议您在尝试拟合任何东西之前,先绘制数据并观察它们。更好地理解数据。