我有一个类别的样本有10000个,而另一个类别的样本只有3500个。这就是我面临类别不平衡问题的原因。sci-kit learn库中是否有对SVM进行惩罚的版本?
回答:
在SVC中,fit
方法中的关键字class-weight
会将参数C
设置为C*value
,其中value>0
。
实际上,class weight
是一个形式为class_label: value
的字典。
参考http://scikit-learn.org/stable/modules/svm.html(第1.4.1.3节)