在k-NN分类中,输出是一个类别成员。一个对象通过其邻居的多数投票来分类,并被分配到其k个最近邻居中最常见的类别(k是一个正整数,通常较小)。
- 如果k=1,那么对象会被简单地分配到那个单一最近邻居的类别中。
- 如果k=3,并且类别标签是Good=2 Bad=1,那么预测的类别标签将是Good,因为它包含多数票。
- 如果k=4,并且类别标签是Good=2 Bad=2,那么类别标签将会是什么?
回答:
有不同的方法。例如,Matlab使用’random’或’nearest’,如这里所记录的。
当分类到两个以上的组或使用偶数值的k时,可能需要打破最近邻居数量的平局。选项有’random’,它选择一个随机的平局破坏者,以及’nearest’,它使用平局组中最近的邻居来打破平局。