为什么我要返回Z
,如果我理解正确的话,Z
是所有被错误分类的点的数组?我不应该返回那些被正确分类的点吗?返回所有我分类错误的点有什么好处呢?
回答:
你选择了两个非常接近但类别不同的实例。这意味着新的点很可能位于分隔类别的边界上,因此保留它对于我们之后的分类非常重要。这就是为什么你要将其添加到Z
中。
如果它们属于同一个类别,那就意味着这个新点没有提供比我们已经在Z
中拥有的信息更多的有用信息,所以我们会跳过它,不添加它。直觉上,我们试图只保留每个类别的边界点,而跳过那些位于同一类别边界中间的点。
请记住,这仍然是一种贪婪方法,可能我们丢弃的一个点如果以不同的顺序处理会是有用的。同样有用的还有维基百科文章。