训练SVM分类器时的奇怪行为

我正在寻找训练我的SVM分类器的最佳C值（成本参数）。这是我的代码：

clear all; close all; clc% Load training features and labels[y, x] = libsvmread('training_data.train'); %the training dataset is named training_data.traincost=[2^-7,2^-5,2^-3,2^-1,2^1,2^3,2^5,2^7,2^9,2^11,2^13,2^15];accuracy=zeros(1,length(cost)); %This array will store the accuracy values corresponding to each element in the cost arrayfor i = 1:length(cost)  opt = sprintf('-c %i -v 3',cost(i));  accuracy(i)=svmtrain(y,x,opt);endaccuracy

我使用的是LIBSVM库。当我运行这个程序时，准确率数组中填充了一些非常奇怪的值：这是输出结果：

第1到8列：

67.335 93.696 91.404 92.550 93.696 93.553 93.553 93.553

第9到12列：

93.553 93.553 93.553 93.553

这意味着我在2^-5时获得了最高的交叉验证准确率。我应该在最高的C值上获得最高的准确率吗？（据我所知，它是错误分类的惩罚因子）。这种行为是正常的吗？（我正在使用UCI机器学习数据库构建一个用于乳腺癌识别的分类器）。

回答：

我应该在最高的C值上获得最高的准确率吗？（据我所知，它是错误分类的惩罚因子）。

不，没有保证，因为SVM的成本不是基于准确率的，它使用一个特定的替代函数，这个函数只是大致表现得像准确率，但你可以预期会有很多随机波动。一般来说，你可以预期在高C值时会有高准确率，但不一定是最高的准确率。

这种行为是正常的吗？（我正在使用UCI机器学习数据库构建一个用于乳腺癌识别的分类器）。

是的，这是可能的结果。

学技术

训练SVM分类器时的奇怪行为

发表回复取消回复

相关文章：

使用 LibSVM 计算与均值/标准差对最接近的匹配项

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复