我正在使用for循环来调节SVM模型,搜索超参数空间的范围。学习得到的svm
模型包含以下字段:
SVMModel: [1×1 ClassificationSVM] C: 2FeaturesIdx: [4 6 8] Score: 0.0142
问题1)字段’score’的含义及其用途是什么?
问题2)我正在调节BoxConstraint
,即C值。假设特征数量由变量featsize
表示。变量gridC
将包含搜索空间,可以从任何值开始,例如2^-5, 2^-3, 到2^15等。因此,gridC = 2.^(-5:2:15)
。我不知道是否有选择范围的方法?
回答:
1. score
已在这里进行了说明,内容如下:
分类得分 SVM分类得分用于对观测值x进行分类,是x到决策边界的带符号距离,范围从-∞到+∞。对于某个类别,正得分表示预测x属于该类别;负得分则表示不属于该类别。
在二分类情况下,如果有六个观测值,预测函数给出了一个称为TestScore
的得分值,我们可以通过以下方式确定特定观测值所属的类别:
TestScore=[-0.4497 0.4497 -0.2602 0.2602; -0.0746 0.0746; 0.1070 -0.1070; 0.2841 -0.2841; 0.4566 -0.4566;];[~,Classes] = max(TestScore,[],2);
在二分类中,我们也可以使用find(TestScore > 0)
来替代,很明显前三个观测值属于第二类,第四到第六个观测值属于第一类。
在多分类情况下,可能有多个得分>0,但代码max(scores,[],2)
仍然有效。例如,我们可以使用以下代码(来自这里,一个名为使用二元SVM查找多类边界的示例)来确定预测Samples
的类别。
for j = 1:numel(classes); [~,score] = predict(SVMModels{j},Samples); Scores(:,j) = score(:,2); % 第二列包含正类得分end[~,maxScore] = max(Scores,[],2);
然后,maxScore
将表示每个样本的预测类别。
2. BoxConstraint
表示SVM模型中的C
,因此我们可以在不同的超参数下训练SVM,并通过类似以下方式选择最佳模型:
gridC = 2.^(-5:2:15);for ii=1:length(gridC)SVModel = fitcsvm(data3,theclass,'KernelFunction','rbf',... 'BoxConstraint',gridC(ii),'ClassNames',[-1,1]);%if (%满足某些条件) % %保存当前的SVModel%endend
注意:实现这一过程的另一种方法是使用libsvm,这是一个快速且易于使用的SVM工具箱,提供了MATLAB接口。