支持向量机模型的具体性应达到何种程度?

使用支持向量机(SVM)的主要目的是让算法能够决定输入是真还是假等等。

我正在尝试使用SVM进行预测性维护,以预测系统过热的可能性。

在我的例子中,温度范围是0-102°C,如果温度达到80°C或以上,则被归类为故障。

我的输入是包含30个双精度浮点数的数组(最近30次读数)。

我在制作一些样本输入来训练SVM,我想知道是否应该传入非常具体的数据来进行训练 – 例如,传入80°C, 81°C … 102°C的数组,这样模型会自动将这些值与故障关联起来。你也可以传入30个79°C的数组,并设置为通过。

这种方法似乎是一种完整的做法,但如果输入这样的数组 – 这不就相当于硬编码一个开关语句,当温度读数为80->102°C时触发吗?

传入这些“硬编码”风格的数组是否是个好主意,还是我应该坚持使用更随机的输入?


回答:

如果可能性的集合是有限的,我强烈推荐使用朴素贝叶斯,因为这种方法非常适合这个问题。然而,如果你被迫使用SVM,我认为这会相当困难。首先,SVM的主要思想是用于分类,情景的数量并不重要。然而,输入通常很少是离散的,所以我认为通常有无限的情景。然而,通常实现的SVM只能给你一个分类,除非你有100个类,每个类代表1%的概率,否则这并不能真正解决问题。

结论是,这可能有效,但这不被认为是“最佳实践”。你可以想象你的30维向量空间被划分为100个小子空间,每个数据点,一个30×1的向量,是那个向量空间中的一个点,因此概率由它所在的100个子集中的哪一个决定。然而,拥有100个类,并且数据不干净或不足,会导致模型表现非常差,难以优化。

祝好 🙂

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注