结合多个模型提取的特征集

我使用Sklearn和Caffe从大量训练和测试图像中提取了特征。为了进行特征提取,我使用了Caffe Model Zoo中的3个不同的预训练卷积网络。

使用这3组特征中的任何一组,我都可以训练一个在测试数据上准确率约为80%的SVM。但是,如何最好地利用所有3组特征的优势呢?

我尝试过简单地将3个独立SVM的结果平均(平均每个标签的概率预测),但这并没有比单一模型带来任何改进。

将特征集连接成一个大的集合,然后用它来训练SVM(或其他模型)会有所帮助吗?

请注意,数据集是多类多标签的。谢谢。


回答:

这种组合特征的方法并不好。在机器学习中,我们使用集成技术。集成技术包括:装袋(bagging)、提升(boosting)、堆叠(stacking)和层次(hierarchy)。根据我的经验,我喜欢使用提升或堆叠。提升是一种贪婪的学习策略,它不断改变数据的分布以及用于训练每个基础学习器的特征,使得后续的基础学习器能够专注于难处理的样本。了解一下Viola-Jones Adaboost分类器。如果你有严重的数据不平衡问题,可以了解一下SMOTEBoost算法。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注