预期结果应该是什么
当我手动计算时,我得到 P(y=1|x=1) > P(y=0|x=1)。但是模型预测的输出是0。
from sklearn.naive_bayes import GaussianNB,MultinomialNBxx = [[1],[1],[1],[2],[2],[3]]yy = [1,1,1,0,0,0]# clf = GaussianNB()clf = MultinomialNB()clf.fit(xx,yy)print(clf.predict([[1]]))
我还尝试将alpha参数从1改到1000。对于输入=1,输出仍然是0。
回答:
对于多项式朴素贝叶斯,模型假设特征是来自多项式分布的计数。以下代码应该能清楚地说明这一点:
import numpy as npfrom sklearn.naive_bayes import MultinomialNBfrom sklearn.preprocessing import MultiLabelBinarizerxx = [[1],[1],[1],[2],[2],[3]]yy = [1,1,1,0,0,0]mlb = MultiLabelBinarizer()xxtransformed = mlb.fit_transform(xx)print(xxtransformed)# [[1 0 0]# [1 0 0]# [1 0 0]# [0 1 0]# [0 1 0]# [0 0 1]]clf = MultinomialNB()clf.fit(xxtransformed,yy)print(mlb.transform(np.array([[1]])))#[[1 0 0]]print(clf.predict(mlb.transform(np.array([[1]]))))#[1]
确实,我们得到了预期的预测结果1