我正在阅读一篇关于支持向量机(SVM)的教程。
作者在其中写道:
一般来说,支持向量机比K最近邻算法更好地处理无意义数据
他所说的“无意义数据”是什么意思?
回答:
这句话指的是前面的句子:
请注意,如果我们注释掉删除id列的部分,准确率会下降到60%左右。
以及在K最近邻教程中,研究了当输入模型的“无用”数据(即噪声),例如数据点的索引时,模型性能的变化。
[…] 让我们展示一下当我们确实包含真正无意义和误导性数据时会发生什么,通过注释掉删除id列的操作
这里的结论是,SVM比KNN更好地处理输入中的无意义特征、噪声或“无意义数据”。