我有一个异常检测问题,涉及大量的信号数据(1700, 64100),这是数据框的长度。问题是我在异常检测方面是初学者,并且训练集中没有异常(当然,验证集中有一些)。
我尝试使用KNN和隔离森林方法,并使用了pyod库,但有一个“contamination”参数需要大于0。然而,正如之前所说,我的案例中没有异常。
提前感谢您
回答:
contamination定义了您对数据中异常点百分比的预期。如果没有异常点,您为什么要检测它们呢?
我认为更好的方法是使用整个数据集来构建模型,而不是进行训练/测试拆分 🙂