K近邻算法在分类和回归中的使用有什么区别?
当在推荐系统中使用KNN时,它是属于分类还是回归?
回答:
在分类任务中,用户试图预测一个类别
,通常以整数标签表示,但代表的是“事物”的类别。例如,你可以尝试将图片分类为“猫”和“狗”,并使用标签0表示“猫”,1表示“狗”。
用于分类的KNN算法会查看你试图进行预测的输入的k个最近邻居。然后,它会输出这些k个示例中最常见的标签。
在回归任务中,用户希望输出一个数值(通常是连续的)。例如,估计房价,或评估电影的质量。
在这种情况下,KNN算法会收集与你想要进行预测的示例最接近的k个示例相关联的值,并将它们聚合以输出一个单一值。通常,你会选择k个邻居值的平均值,但你也可以选择中位数或加权平均值(或者实际上是你认为对当前任务有意义的任何方法)。
对于你的具体问题,你可以使用这两种方法,但在我看来,回归更适合预测用户与你想要推荐给他的物品之间的某种“匹配百分比”。