时间序列数据的隔离森林

我想知道隔离森林(iForest)是否可以用于时间序列数据。据我所知,iForest 用于异常检测,它基于随机化技术来随机且递归地分割数据,然后将分割保存在树结构中。

我有一个理论上的问题。我想知道iForest是否可以用于时间序列数据,因为它基于一些随机化技术。这种随机化会破坏时间依赖性,从而违反时间序列的特性吗?


回答:

隔离森林默认情况下会帮助检测点异常,因为原则上它只是基于这些观察的稀有性来工作。

但假设我对时间序列数据中的异常感兴趣。隔离森林能够挑选出作为点异常出现的极端峰值和谷值,但在处理集体异常时,您可能需要转换数据,使得每个观察代表一组观察(滚动窗口操作)等。

原因是,在时间序列数据中,您关注的是加性异常或时间变化,因此如果您计划使用隔离森林,您的观察必须个别地代表这些特征。但您可以尝试其他技术,如STL分解、Arima、回归树、指数平滑。您应该能找到很多关于如何使用上述方法进行时间序列异常检测的资料。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注