我正在尝试将机器学习算法应用于一个数据集,该数据集包含一个名为SO2(目标变量)的引擎排放的污染气体数据,这些数据是在6个月的时间内每隔15分钟收集一次。数据集中还包括其他独立变量,如压力、蒸汽等,均与时间相关。现在的问题是,我应该使用像ARIMA这样的时间序列模型来预测SO2,还是应该使用随机森林或SVM进行预测?
谢谢
回答:
我建议你选择时间序列建模而不是SVM。你的SVM会认为样本是独立同分布的(i.i.d),不会考虑跨时间封装的信息。
我正在尝试将机器学习算法应用于一个数据集,该数据集包含一个名为SO2(目标变量)的引擎排放的污染气体数据,这些数据是在6个月的时间内每隔15分钟收集一次。数据集中还包括其他独立变量,如压力、蒸汽等,均与时间相关。现在的问题是,我应该使用像ARIMA这样的时间序列模型来预测SO2,还是应该使用随机森林或SVM进行预测?
谢谢
回答:
我建议你选择时间序列建模而不是SVM。你的SVM会认为样本是独立同分布的(i.i.d),不会考虑跨时间封装的信息。