我在Java中实现了KNN分类器,并得到了一个奇怪的结果。如果我对数据集进行情感分析,例如亚马逊书籍评论,我得到了55%的精度。在100个测试文档中,有55个被正确分类为负面或正面评论,45个分类错误。但是,如果我使用KNN进行类别分类,例如相机或书籍,我得到了95%的精度。
这是否说明我的代码有问题?有什么想法吗?
回答:
@[隐藏人名] 是对的。这两种方法有一个关键的区别对你来说很重要。情感分析(基于简单的词袋模型)通常比你情况下的类别分类要复杂得多。
顺便提一下,只有一个澄清,55%不是精度,那是准确率。(更多信息:http://en.wikipedia.org/wiki/Accuracy_and_precision#In_binary_classification)