我有一个多类SVM分类器,标签为’A’、’B’、’C’、’D’。
这是我运行的代码:
>>>print clf.predict([predict_this])['A']>>>print clf.decision_function([predict_this])[[ 185.23220833 43.62763596 180.83305074 -93.58628288 62.51448055 173.43335293]]
如何使用decision_function的输出预测具有最高概率的类(A/B/C/D),如果可能的话,还要知道其概率值?我访问过https://stackoverflow.com/a/20114601/7760998,但那是针对二元分类器的,我找不到好的资源来解释多类分类器的decision_function输出,形状为ovo(一对一)。
编辑:
上面的例子是针对类’A’。对于另一个输入,分类器预测为’C’,并在decision_function中给出了以下结果
[[ 96.42193513 -11.13296606 111.47424538 -88.5356536 44.29272494 141.0069203 ]]
对于另一个不同的输入,分类器预测为’C’,decision_function给出了以下结果,
[[ 290.54180354 -133.93467605 116.37068951 -392.32251314 -130.84421412 284.87653043]]
如果是ovr(一对其余),通过选择值较高的那个会变得更容易,但在ovo(一对一)中,结果列表中有(n * (n - 1)) / 2
个值。
如何根据decision_function推断出将选择哪个类?
回答:
对于正在寻找这个问题答案的任何人,请访问这个被接受的答案,我在DataScience Stack Exchange上发布了相同的问题,并得到了所需的答案。