假设我的输入特征是X = {X1, X2}
。其中X1是实数值(假设它符合高斯分布),而X2
是一个分类特征。现在如果我想使用朴素贝叶斯算法,我应该使用哪一个?另一个问题是,GaussianNB在处理分类特征时效果如何?
回答:
可以使用get_dummies()
(pandas库)转换你的分类特征X2。然后训练模型。
我建议先尝试GaussianNB,并评估其准确性。然后再尝试sklearn提供的其他朴素贝叶斯模型。在没有看到数据(即使拥有数据)的情况下,很难预测哪种模型在每种情况下表现更好。请分别评估每一种模型。