在sk-learn中,是否有方法让分类模型输出一个预测的置信度或概率,而不是仅仅输出类别(即使只有两个类别)?
直觉上,有些样本应该明确归属于某一类,而其他样本则可能处于边界状态,对于某些实际问题来说,区分这些样本可能会很有用。
回答:
如果你查看sklearn的分类器文档,会发现其中一些分类器有类似predict_proba()
(或像SVM和Logistic回归等模型提到的decision_function
)的函数。例如,在RandomForestClassifier的文档中可以看到这里。每个类的概率计算方式取决于具体的模型,但它们应该会为你输入的每个样本计算出每个类的概率。