我需要一个描述性示例,展示如何对两类数据集进行10折SVM分类。MATLAB文档中只有一个示例,但它不是10折的。有人能帮我吗?
回答:
这是一个完整的示例,使用了生物信息学工具箱中的以下函数:SVMTRAIN,SVMCLASSIFY,CLASSPERF,CROSSVALIND。
load fisheriris %# 加载iris数据集
groups = ismember(species,'setosa'); %# 创建一个两类问题
%# 交叉验证折数:
%# 如果你有50个样本,将它们分成10组,每组5个样本,
%# 然后用9组(45个样本)训练,用1组(5个样本)测试。
%# 这将重复十次,每组都恰好用作一次测试集。
%# 最后将10个折的结果平均,产生一个单一的
%# 性能估计。
k=10;
cvFolds = crossvalind('Kfold', groups, k); %# 获取10折CV的索引
cp = classperf(groups); %# 初始化性能跟踪器
for i = 1:k %# 对于每个折
testIdx = (cvFolds == i); %# 获取测试实例的索引
trainIdx = ~testIdx; %# 获取训练实例的索引
%# 在训练实例上训练一个SVM模型
svmModel = svmtrain(meas(trainIdx,:), groups(trainIdx), ...
'Autoscale',true, 'Showplot',false, 'Method','QP', ...
'BoxConstraint',2e-1, 'Kernel_Function','rbf', 'RBF_Sigma',1);
%# 使用测试实例进行测试
pred = svmclassify(svmModel, meas(testIdx,:), 'Showplot',false);
%# 评估并更新性能对象
cp = classperf(cp, pred, testIdx);
end
%# 获取准确率
cp.CorrectRate
%# 获取混淆矩阵
%# 列:实际,行:预测,最后一行:未分类实例
cp.CountingMatrix
输出结果为:
ans = 0.99333
ans = 100 1 0 49 0 0
我们获得了99.33%
的准确率,只有一个’setosa’实例被误分类为’non-setosa’
更新:在R2013a版本中,SVM函数已移至统计工具箱