我的问题可能比较复杂,但我希望了解Mahout
中StandardNaiveBayesClassifier
和ComplementaryNaiveBayesClassifier
算法的主要区别。在训练数据较少的情况下,哪一种表现更好,还是这取决于数据本身?哪一种更适合情感分析?还有其他一些方面…
提前感谢!
回答:
Complement naive Bayes是一种朴素贝叶斯变体,当训练集中类别不平衡时,它的表现往往比标准版本更好。简而言之,它基于类别y的补集,即所有其他类别的样本来估计每个类别y的特征概率,而不是基于类别y本身的训练样本。