如何确定SVM调参时超参数空间的范围?(MATLAB)

我正在使用for循环来调节SVM模型,搜索超参数空间的范围。学习得到的svm模型包含以下字段:

   SVMModel: [1×1 ClassificationSVM]          C: 2FeaturesIdx: [4 6 8]      Score: 0.0142

问题1)字段’score’的含义及其用途是什么?

问题2)我正在调节BoxConstraint,即C值。假设特征数量由变量featsize表示。变量gridC将包含搜索空间,可以从任何值开始,例如2^-5, 2^-3, 到2^15等。因此,gridC = 2.^(-5:2:15)。我不知道是否有选择范围的方法?


回答:

1. score已在这里进行了说明,内容如下:

分类得分 SVM分类得分用于对观测值x进行分类,是x到决策边界的带符号距离,范围从-∞到+∞。对于某个类别,正得分表示预测x属于该类别;负得分则表示不属于该类别。

在二分类情况下,如果有六个观测值,预测函数给出了一个称为TestScore的得分值,我们可以通过以下方式确定特定观测值所属的类别:

TestScore=[-0.4497    0.4497           -0.2602    0.2602;           -0.0746    0.0746;            0.1070   -0.1070;            0.2841   -0.2841;            0.4566   -0.4566;];[~,Classes] = max(TestScore,[],2);

在二分类中,我们也可以使用find(TestScore > 0)来替代,很明显前三个观测值属于第二类,第四到第六个观测值属于第一类。

在多分类情况下,可能有多个得分>0,但代码max(scores,[],2)仍然有效。例如,我们可以使用以下代码(来自这里,一个名为使用二元SVM查找多类边界的示例)来确定预测Samples的类别。

for j = 1:numel(classes);    [~,score] = predict(SVMModels{j},Samples);    Scores(:,j) = score(:,2); % 第二列包含正类得分end[~,maxScore] = max(Scores,[],2);

然后,maxScore将表示每个样本的预测类别。

2. BoxConstraint表示SVM模型中的C,因此我们可以在不同的超参数下训练SVM,并通过类似以下方式选择最佳模型:

gridC = 2.^(-5:2:15);for ii=1:length(gridC)SVModel = fitcsvm(data3,theclass,'KernelFunction','rbf',...    'BoxConstraint',gridC(ii),'ClassNames',[-1,1]);%if (%满足某些条件) %  %保存当前的SVModel%endend

注意:实现这一过程的另一种方法是使用libsvm,这是一个快速且易于使用的SVM工具箱,提供了MATLAB接口。

Related Posts

在使用k近邻算法时,有没有办法获取被使用的“邻居”?

我想找到一种方法来确定在我的knn算法中实际使用了哪些…

Theano在Google Colab上无法启用GPU支持

我在尝试使用Theano库训练一个模型。由于我的电脑内…

准确性评分似乎有误

这里是代码: from sklearn.metrics…

Keras Functional API: “错误检查输入时:期望input_1具有4个维度,但得到形状为(X, Y)的数组”

我在尝试使用Keras的fit_generator来训…

如何使用sklearn.datasets.make_classification在指定范围内生成合成数据?

我想为分类问题创建合成数据。我使用了sklearn.d…

如何处理预测时不在训练集中的标签

已关闭。 此问题与编程或软件开发无关。目前不接受回答。…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注