用于捕捉图像中微小特征的深度学习模型是哪一种?

我有一个类,它与其他类有一些细微的不同特征:例如 – 这张图片上有扣环(可以认为它是一个类) https://6c819239693cc4960b69-cc9b957bf963b53239339d3141093094.ssl.cf3.rackcdn.com/1000006329245-822018-Black-Black-1000006329245-822018_01-345.jpg

但是,这张图片与它非常相似,但没有扣环: https://sc01.alicdn.com/kf/HTB1ASpYSVXXXXbdXpXXq6xXFXXXR/latest-modern-classic-chappal-slippers-for-men.jpg

我对在这种情况下使用哪种模型感到有点困惑,这种模型实际上是学习像素到像素的值的。

任何想法都会受到欢迎。谢谢!!

我已经尝试过Inception、Resnet等模型。

在每个类别只有少量训练数据(每个类别大约300-400个)的情况下,我们能否达到较好的召回率/精确度/F1分数。


回答:

由于数据集较小,你可能需要考虑使用迁移学习。你可以使用一个转移过的ResNet模型作为特征提取器,并尝试在其上应用YOLO(你只看一次)算法,通过滑动窗口(查看使用卷积网络的滑动窗口实现)来检测每个窗口中的腰带扣环,并据此对图像进行分类。

根据我对你的数据集的理解,要采用上述方法,你需要重新标注数据集以满足YOLO算法的要求。

要查看上述方法的一个例子,请访问 https://mc.ai/implementing-yolo-using-resnet-as-feature-extractor/

编辑 如果你有XML标注的数据集,并且需要将其转换为csv以遵循上述示例,请使用 https://github.com/datitran/raccoon_dataset

祝你建模愉快。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注