我在Python中实现了一个KNN算法。
这个算法大多数情况下运行良好,并且我得到了正确的标签。例如,对于D,我确实得到了“好”的标签。然而,我发现了一个问题,当我连续调用两次函数时,例如:
calc_distance(data_set,D)get_neibours(7)calc_distance(data_set,D)get_neibours(7)
并且我运行了几次程序,得到的输出不同——有时候是“好”,有时候是“坏”…
肯定有某个地方存在bug,但我无法找到。
回答:
问题在于你使用了相同的距离和标签列表,对其进行排序并获取前k个元素。你应该在函数内部创建这些列表并返回它们。请查看下面的修改。
[(7.071, ‘Good’), (8.062, ‘Bad’), (8.888, ‘Bad’), (9.11, ‘Good’), (10.1, ‘Good’), (10.488, ‘Bad’), (11.958, ‘Good’)]It can be classified as: Good
[(7.071, ‘Good’), (8.062, ‘Bad’), (8.888, ‘Bad’), (9.11, ‘Good’), (10.1, ‘Good’), (10.488, ‘Bad’), (11.958, ‘Good’)]It can be classified as: Good