在CNN提取的特征上使用SVM – 如何进行多类分类?

在MNIST数据集中,有10个分类输出。现在,我想使用SVM作为这个分类任务的分类器。我首先使用CNN架构(不包括顶层或分类器)从原始图像中提取特征,然后将其拟合到SVM分类器中。

SVM是一个二元分类器,因此我们可以使用一对一一对其余方法来处理这种情况。我使用了sci-kit learn官方文档中提供的以下实现代码。但是,我无法确定在哪里指定模型关于多类标签的信息,或者这是一对一还是一对其余方法。

数据集的形状如下所示:

train : (2045, 32, 32)label : (2045, 10)

使用非顶层CNN代码提取特征后,我们得到:

train : (7636, 256)  < - cnn_Xtrainlabel : (7636,)      < - Ytrain

我尝试过的SVM分类器

# SVC classifierSVMC = SVC(probability=True)svc_param_grid = {'kernel': ['rbf'],                   'gamma': [0.0001, 0.001],                  'C': [1, 10, 50]}gsSVMC = GridSearchCV(SVMC, param_grid = svc_param_grid, cv = K_fold,                      scoring="accuracy", n_jobs= -1, verbose = 1)gsSVMC.fit(cnn_Xtrain, Ytrain) # fitting extracted featuresSVMC_best = gsSVMC.best_estimator_

在这个分类器中,SVM如何理解这是多类问题,还是一对一或一对其余?对我来说,分数结果更令人怀疑,我评估的准确率确实达到了98%。是网格搜索中指定的核(RBF)负责这个结果吗?还是我在这里做错了什么?

此外,使用CNN代码从原始图像中提取特征,然后将其拟合到SVM或类似分类器中,这样做可以吗?


回答:

决定使用一对其余还是一对一的方法是在分类器的’decision_function_shape’参数中设置的(参见svc文档)。文档中说明:

是返回形状为(n_samples, n_classes)的一对其余(‘ovr’)决策函数,像所有其他分类器一样,还是返回libsvm的原始一对一(‘ovo’)决策函数,形状为(n_samples, n_classes * (n_classes – 1) / 2)。然而,一对一(‘ovo’)总是作为多类策略使用。版本0.19中更改:decision_function_shape默认为‘ovr’。版本0.17中新增:推荐使用decision_function_shape=‘ovr’。版本0.17中更改:废弃decision_function_shape=‘ovo’和None。

因此,现在一对其余是默认的,因为你没有指定这个参数,所以可能在你的代码中使用了这个方法。

关于你使用CNN进行特征提取然后拟合的问题:一般来说这是可以的。然而,使用正确的核,应该不需要这样做。如果你想减少特征向量的维度,你可以直接使用pca或非线性嵌入方法,如流形嵌入来获得更少的特征。

希望这对你有帮助。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注