在CNN提取的特征上使用SVM – 如何进行多类分类？

在MNIST数据集中，有10个分类输出。现在，我想使用SVM作为这个分类任务的分类器。我首先使用CNN架构（不包括顶层或分类器）从原始图像中提取特征，然后将其拟合到SVM分类器中。

SVM是一个二元分类器，因此我们可以使用一对一或一对其余方法来处理这种情况。我使用了sci-kit learn官方文档中提供的以下实现代码。但是，我无法确定在哪里指定模型关于多类标签的信息，或者这是一对一还是一对其余方法。

数据集的形状如下所示：

train : (2045, 32, 32)label : (2045, 10)

使用非顶层CNN代码提取特征后，我们得到：

train : (7636, 256)  < - cnn_Xtrainlabel : (7636,)      < - Ytrain

我尝试过的SVM分类器

# SVC classifierSVMC = SVC(probability=True)svc_param_grid = {'kernel': ['rbf'],                   'gamma': [0.0001, 0.001],                  'C': [1, 10, 50]}gsSVMC = GridSearchCV(SVMC, param_grid = svc_param_grid, cv = K_fold,                      scoring="accuracy", n_jobs= -1, verbose = 1)gsSVMC.fit(cnn_Xtrain, Ytrain) # fitting extracted featuresSVMC_best = gsSVMC.best_estimator_

在这个分类器中，SVM如何理解这是多类问题，还是一对一或一对其余？对我来说，分数结果更令人怀疑，我评估的准确率确实达到了98%。是网格搜索中指定的核（RBF）负责这个结果吗？还是我在这里做错了什么？

此外，使用CNN代码从原始图像中提取特征，然后将其拟合到SVM或类似分类器中，这样做可以吗？

回答：

决定使用一对其余还是一对一的方法是在分类器的’decision_function_shape’参数中设置的（参见svc文档）。文档中说明：

是返回形状为(n_samples, n_classes)的一对其余（‘ovr’）决策函数，像所有其他分类器一样，还是返回libsvm的原始一对一（‘ovo’）决策函数，形状为(n_samples, n_classes * (n_classes – 1) / 2)。然而，一对一（‘ovo’）总是作为多类策略使用。版本0.19中更改：decision_function_shape默认为‘ovr’。版本0.17中新增：推荐使用decision_function_shape=‘ovr’。版本0.17中更改：废弃decision_function_shape=‘ovo’和None。

因此，现在一对其余是默认的，因为你没有指定这个参数，所以可能在你的代码中使用了这个方法。

关于你使用CNN进行特征提取然后拟合的问题：一般来说这是可以的。然而，使用正确的核，应该不需要这样做。如果你想减少特征向量的维度，你可以直接使用pca或非线性嵌入方法，如流形嵌入来获得更少的特征。

希望这对你有帮助。

学技术

在CNN提取的特征上使用SVM – 如何进行多类分类？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复