我通过读取数据集中的关键绩效指标(KPI)来生成警报。我的算法会查看历史数据,并基于此捕捉数据中的突然激增。但我会产生虚假警报。例如,KPI1 历史上为0.5,但达到12,这是一种激增。同样,KPI2 也从0.5达到12。但我知道 KPI 从0.5达到12 并不重要,我不需要捕捉这种情况。同样,KPI2 从0.5达到12 是重要的,我需要捕捉这种情况。我想训练我的程序理解每个 KPI 的高值、低值或正常值。你们这些专家能告诉我哪种机器学习算法最适合这个任务吗?还有我需要探索的 Python 包是什么?
回答:
这是一个分类问题。你可以使用经典的逻辑回归算法,将任何给定的样本分类为高值、低值或正常值。
引用自维基百科,
在统计学中,多项式逻辑回归是一种分类方法,它将逻辑回归推广到多类问题,即具有两个以上可能的离散结果。也就是说,它是一种用于预测给定一组独立变量(可以是实值、二值、分类值等)时,分类分布的依赖变量的不同可能结果的概率的模型。
在 Python 中进行多类分类时,sklearn 库会很有用。