In:svc1.predict([X_poly[25].reshape(1,-1))Out:array([3], dtype=int64)In:svc1.decision_function([X_poly[25]])Out:array([[ 0.58348329, -0.99979492, 0.08571431, -0.99996706, -0.52397444, 0.99959056]])In:svc1.predict_proba(X_poly[25].reshape(1,-1))Out:array([[ 0.48373954, 0.11870606, 0.00261101, 0.39494339]])
我使用的是rbf核和’ovo’分类方法。我试图预测数据中第26个样本的类别。SVC分类器预测该样本的类别为3。然而,我无法理解为什么当概率显示其他结果时,它会选择类别3。您能否解释一下decision_function方法的输出及其如何用于预测类别的方法?
回答:
正如文档所述:
概率模型是通过交叉验证创建的,因此结果可能与predict方法得到的结果略有不同。此外,在非常小的数据集上,它会产生无意义的结果。
我认为这就是您得到不同输出结果的原因。
关于ovo
(一对一)决策函数,由于您的决策函数返回了6个值,这意味着您有4个类别:
(n*(n-1))/2 = 6
,其中n是类别的数量。
现在,如何使用decision_function返回的数值来预测类别。正如其名(一对一),它是一对一地比较类别,然后输出一个正数或负数来表示它认为哪个类别是正确的。在您的案例中,由于我们有4个类别,它产生了6个数字,这些数字代表了类别(1,2,3,4)之间的比较,如下所示:[12,13,14,23,24,34]
,在您的案例中由以下决策向量表示:
[0.58348329, -0.99979492, 0.08571431, -0.99996706, -0.52397444, 0.99959056]
因此,哪个类别获胜取决于这些数字的符号,在这个例子中,获胜的类别是:[1,3,1,3,4,3]
,即'12'
由0.58348329
比较,因此类别'1'
获胜…依此类推。因此,决策函数投票选择类别'3'
作为您的预测,因为它是获胜次数最多的类别。