我在使用SVM进行一些机器学习任务时,怀疑数据是非线性的,因此也引入了RBF核。我发现使用RBF核的SVM性能远不如线性SVM。我想知道是否是我在分类器参数设置上出了问题。
我的代码如下:
from sklearn.svm import LinearSVCfrom sklearn.svm import SVCsvm1 = LinearSVC() # 表现最佳,类似于逻辑回归的结果,这是预期之内的svm2 = LinearSVC(class_weight="auto") # 表现略差于svm1svm3 = SVC(kernel='rbf', random_state=0, C=1.0, cache_size=4000, class_weight='balanced') # 表现远差于svm1;处理时间最长svm4 = SVC(kernel='rbf', random_state=0, C=1.0, cache_size=4000) # 这是所有中最差的,分类器简单地选择了多数类
回答:
在使用RBF核时,尝试调整你的C
和gamma
参数。Scikit-learn的网格搜索可以帮助你。
这里有一个示例供你开始:
svc = SVC(...)params = {"C":[0.1, 1, 10], "gamma": [0.1, 0.01, 0.001]}grid_search = GridSearchCV(svc, params)grid_search.fit(X,y)