我想知道隔离森林(iForest)是否可以用于时间序列数据。据我所知,iForest 用于异常检测,它基于随机化技术来随机且递归地分割数据,然后将分割保存在树结构中。
我有一个理论上的问题。我想知道iForest是否可以用于时间序列数据,因为它基于一些随机化技术。这种随机化会破坏时间依赖性,从而违反时间序列的特性吗?
回答:
隔离森林默认情况下会帮助检测点异常,因为原则上它只是基于这些观察的稀有性来工作。
但假设我对时间序列数据中的异常感兴趣。隔离森林能够挑选出作为点异常出现的极端峰值和谷值,但在处理集体异常时,您可能需要转换数据,使得每个观察代表一组观察(滚动窗口操作)等。
原因是,在时间序列数据中,您关注的是加性异常或时间变化,因此如果您计划使用隔离森林,您的观察必须个别地代表这些特征。但您可以尝试其他技术,如STL分解、Arima、回归树、指数平滑。您应该能找到很多关于如何使用上述方法进行时间序列异常检测的资料。