我和一个朋友在讨论这个问题。
问题是K的最小值应该是什么,以便”Naeem”可以被分类为:
-
F
-
B
这是我根据矩阵计算的距离值:
Name | A | B | C | Class| Distance from Naeem--------|-------|-------|---|------|--------------------'Kamran'| 35 | 35 | 3 | 'A' | 15.17'Zahid' | 22 | 50 | 2 | 'B' | 15.0'Imran' | 63 | 200 | 1 | 'C' | 152.24'Azfer' | 59 | 170 | 1 | 'D' | 122.0'Raza' | 25 | 40 | 4 | 'E' | 15.75'Aamir' | 35 | 150 | 1 | 'A' | 100.02'Zia' | 25 | 120 | 3 | 'B' | 71.03'Ishrat'| 26 | 90 | 4 | 'C' | 41.53'Khalid'| 40 | 60 | 2 | 'F' | 10.44'Naeem' | 37 | 50 | 2 | ? |
我们同意,为了让Naeem被分类为F类,K值应该是1。然而,当谈到Naeem被分类为B类时,他说K值应该为3,因为这是B类首次被视为最近邻,但我认为在分类时我们不应该有K=3带来的类别平局(F、A、B),而是应该使用K=4,这样我们就有两个B类邻居,并且多数决定胜出,只有当K=4时,Naeem才会被分类为B类。
谁的观点正确,或者我们是否都理解错了?
回答:
据我所知,为了让’Naeem’被分类为’F’,K值必须等于1。
当谈到”Naeem”被分类为B类时,K值必须是B类占多数的数字。当K值设为6时,我们达到了B类的多数。
- K=1 得到 {F}
- K=2 得到 {F,B}
- K=3 得到 {F,B,A}
- K=4 得到 {F,B,A,E}
- K=5 得到 {F,B,A,E,C}
- K=6 得到 {F,B,A,E,C,B}
当K=6时,所有其他变量都重复了一次,而B重复了两次,因此’Naeem’将被分类为B类