如何评估无监督异常检测

我正在尝试通过机器学习预测一个连续值来解决一个回归问题。我的数据集由6个浮点数列组成。

数据来自低价传感器,这解释了为什么我们很可能会遇到一些可以被认为是异常的值。为了解决这个问题,在预测我的连续目标之前,我将预测数据异常,并将其用作数据过滤器,但我的数据没有标签,这意味着我面临的是无监督异常检测问题。

用于此任务的算法包括局部异常因子、单类支持向量机、隔离森林、椭圆包络和DBSCAN

在拟合这些算法后,需要评估它们以选择最佳的一个。有人知道如何评估无监督算法的异常检测吗?


回答:

唯一的方法是生成合成异常,这意味着根据你对典型异常的了解,主动引入异常值。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注