使用scikit-learn SVC的decision_function预测概率,decision_function_shape=’ovo’

我有一个多类SVM分类器,标签为’A’、’B’、’C’、’D’。

这是我运行的代码:

>>>print clf.predict([predict_this])['A']>>>print clf.decision_function([predict_this])[[ 185.23220833   43.62763596  180.83305074  -93.58628288   62.51448055  173.43335293]]

如何使用decision_function的输出预测具有最高概率的类(A/B/C/D),如果可能的话,还要知道其概率值?我访问过https://stackoverflow.com/a/20114601/7760998,但那是针对二元分类器的,我找不到好的资源来解释多类分类器的decision_function输出,形状为ovo(一对一)。

编辑:

上面的例子是针对类’A’。对于另一个输入,分类器预测为’C’,并在decision_function中给出了以下结果

[[ 96.42193513 -11.13296606 111.47424538 -88.5356536 44.29272494 141.0069203 ]]

对于另一个不同的输入,分类器预测为’C’,decision_function给出了以下结果,

[[ 290.54180354 -133.93467605  116.37068951 -392.32251314 -130.84421412   284.87653043]]

如果是ovr(一对其余),通过选择值较高的那个会变得更容易,但在ovo(一对一)中,结果列表中有(n * (n - 1)) / 2个值。

如何根据decision_function推断出将选择哪个类?


回答:

对于正在寻找这个问题答案的任何人,请访问这个被接受的答案,我在DataScience Stack Exchange上发布了相同的问题,并得到了所需的答案。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注