我在阅读一个网页,上面描述了朴素贝叶斯分类如何工作的一个例子:
http://www.statsoft.com/textbook/naive-bayes-classifier
他们的例子涉及到在样本的邻域内,根据其他点的概率来判断一个类别。
这看起来像是朴素贝叶斯和k-最近邻算法的某种混合。这是真的吗?这真的是朴素贝叶斯算法,还是这是一个新的算法?
谢谢。
回答:
这个例子在任何方面都不代表朴素贝叶斯分类器的工作方式,不过它也不是凭空捏造的。
在某些假设下(比如朴素贝叶斯是数据的完美模型,并且有无限量的数据),我们可以得出
“邻域X中COLOR的数量/COLOR的数量”
等于
“X附近的COLOR密度”
这与p(x|COLOR)
成比例
所以最终p(COLOR|x) <proportional to> p(x|COLOR)p(COLOR)
它展示了kNN算法与朴素贝叶斯之间的关系,但仅此而已。