我在为我的数据挖掘任务选择合适的分类器时遇到了问题。
我正在使用统计方法标注网页,并使用 1-4 的等级对它们进行标注,1 代表最差,4 代表最好。
之前,我使用 SVM 来训练系统,因为当时我使用的是二元(1,0)标签。但现在我切换到这种四类标签,我需要更换分类器,因为我认为 SVM 分类器只适用于二分类(如果我错了,请指正)。
在这种情况下,哪种分类器最适合我的分类目的?
回答:
存在多类 SVM。LibSVM 有一个实现,Weka 也有。
通常,最好尝试几种分类器,找出哪一种最适合你的数据。分类器类型和训练算法的选择 *远* 没有你的特征集选择重要。你可以尝试朴素贝叶斯、多类 SVM、最大熵、投票感知器,或者你的库提供的任何东西。