Home IT技术为什么KNN的准确率低但精确率高？

为什么KNN的准确率低但精确率高？

IT技术 xiaolong · 2025年4月7日 · 0 Comment

我使用k-nn对20NG数据集进行了分类，每个类别有200个实例，采用80-20的训练-测试分割，结果如下

enter image description here

这里的准确率相当低，但当准确率这么低时，精确率怎么会高呢？精确率的公式不是TP/(TP + FP)吗？如果是的话，高准确度的分类器需要产生高真阳性率，这将导致高精确率，但K-nn如何在真阳性率非常低的情况下产生高精确率呢？

回答：

召回率等同于真阳性率。文本分类任务（特别是信息检索，但也包括文本分类）显示了召回率和精确率之间的权衡。当精确率非常高时，召回率往往较低，反之亦然。这是由于你可以调整分类器以将更多或更少的实例分类为阳性。你分类为阳性的实例越少，精确率就越高，召回率就越低。

为了确保有效性度量与准确率相关，你应该关注F-measure，它平均了召回率和精确率（F-measure = 2*r*p / (r+p)）。

非惰性分类器遵循一个训练过程，它们试图优化准确率或错误率。K-NN作为惰性分类器，没有训练过程，因此它不试图优化任何有效性度量。你可以尝试不同的K值，直观上，K值越大，召回率越高，精确率越低，反之亦然。

machine-learning nearest-neighbor text-classification weka

发表回复取消回复