使用SVM进行多类分类预测

In:svc1.predict([X_poly[25].reshape(1,-1))Out:array([3], dtype=int64)In:svc1.decision_function([X_poly[25]])Out:array([[ 0.58348329, -0.99979492,  0.08571431, -0.99996706, -0.52397444,     0.99959056]])In:svc1.predict_proba(X_poly[25].reshape(1,-1))Out:array([[ 0.48373954,  0.11870606,  0.00261101,  0.39494339]])

我使用的是rbf核和’ovo’分类方法。我试图预测数据中第26个样本的类别。SVC分类器预测该样本的类别为3。然而,我无法理解为什么当概率显示其他结果时,它会选择类别3。您能否解释一下decision_function方法的输出及其如何用于预测类别的方法?


回答:

正如文档所述:

概率模型是通过交叉验证创建的,因此结果可能与predict方法得到的结果略有不同。此外,在非常小的数据集上,它会产生无意义的结果。

我认为这就是您得到不同输出结果的原因。

关于ovo(一对一)决策函数,由于您的决策函数返回了6个值,这意味着您有4个类别:

(n*(n-1))/2 = 6,其中n是类别的数量。

现在,如何使用decision_function返回的数值来预测类别。正如其名(一对一),它是一对一地比较类别,然后输出一个正数或负数来表示它认为哪个类别是正确的。在您的案例中,由于我们有4个类别,它产生了6个数字,这些数字代表了类别(1,2,3,4)之间的比较,如下所示:[12,13,14,23,24,34],在您的案例中由以下决策向量表示:

[0.58348329, -0.99979492,  0.08571431, -0.99996706, -0.52397444, 0.99959056]

因此,哪个类别获胜取决于这些数字的符号,在这个例子中,获胜的类别是:[1,3,1,3,4,3],即'12'0.58348329比较,因此类别'1'获胜…依此类推。因此,决策函数投票选择类别'3'作为您的预测,因为它是获胜次数最多的类别。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注