我对k-近邻分类器算法完全是个新手。能否有人提供一个好的教程/讲座的链接,里面包含一个数据集,这样我就可以在上面应用k-近邻算法了。
我真的非常需要学习这个,但由于缺乏例子,这项任务变得非常困难。
回答:
我推荐使用鸢尾花数据集。
这可能是模式识别文献中最著名的数据库。Fisher的论文是该领域的经典之作,至今仍被频繁引用(例如,参见Duda & Hart)。该数据集包含3个类别,每个类别有50个实例,每个类别对应一种鸢尾花。其中一个类别与其他两个类别是线性可分的;后两者之间则不是线性可分的。