我使用了scikit-learn
中的MultinomialNB()
。使用predict_proba
时,如何解释这些概率?我的初步猜测是:0.8的概率意味着分类器有80%的把握认为类X是正确的类别。
我找到一个相关问题,但没有提供答案。
回答:
你的直觉是正确的。正如你在文档中所读到的,predict_proba返回模型中每个类别的样本概率。因此,如果我们假设你的训练模型中有4个类别,并且predict_proba返回[0.6, 0.2, 0.19, 0.01](总和总是1),这表示你的数据属于第一类的概率为60%,第二类的概率为20%,依此类推。
文档:https://scikit-learn.org/stable/modules/generated/sklearn.naive_bayes.MultinomialNB.html