用于捕捉图像中微小特征的深度学习模型是哪一种?

我有一个类,它与其他类有一些细微的不同特征:例如 – 这张图片上有扣环(可以认为它是一个类) https://6c819239693cc4960b69-cc9b957bf963b53239339d3141093094.ssl.cf3.rackcdn.com/1000006329245-822018-Black-Black-1000006329245-822018_01-345.jpg

但是,这张图片与它非常相似,但没有扣环: https://sc01.alicdn.com/kf/HTB1ASpYSVXXXXbdXpXXq6xXFXXXR/latest-modern-classic-chappal-slippers-for-men.jpg

我对在这种情况下使用哪种模型感到有点困惑,这种模型实际上是学习像素到像素的值的。

任何想法都会受到欢迎。谢谢!!

我已经尝试过Inception、Resnet等模型。

在每个类别只有少量训练数据(每个类别大约300-400个)的情况下,我们能否达到较好的召回率/精确度/F1分数。


回答:

由于数据集较小,你可能需要考虑使用迁移学习。你可以使用一个转移过的ResNet模型作为特征提取器,并尝试在其上应用YOLO(你只看一次)算法,通过滑动窗口(查看使用卷积网络的滑动窗口实现)来检测每个窗口中的腰带扣环,并据此对图像进行分类。

根据我对你的数据集的理解,要采用上述方法,你需要重新标注数据集以满足YOLO算法的要求。

要查看上述方法的一个例子,请访问 https://mc.ai/implementing-yolo-using-resnet-as-feature-extractor/

编辑 如果你有XML标注的数据集,并且需要将其转换为csv以遵循上述示例,请使用 https://github.com/datitran/raccoon_dataset

祝你建模愉快。

Related Posts

如何从数据集中移除EXIF数据?

我在尝试从数据集中的图像中移除EXIF数据(这些数据将…

用于Python中的“智能点”游戏的遗传算法不工作

过去几天我一直在尝试实现所谓的“智能点”游戏。我第一次…

哪个R平方得分更有帮助?

data.drop(‘Movie Title’, ax…

使用线性回归预测GRE分数对录取率的影响

我正在学习线性回归,并尝试在Jupyter笔记本中用P…

使用mlrMBO贝叶斯优化进行SVM超参数调优时出现错误

我试图针对一个分类任务优化SVM,这个方法在许多其他模…

Keras模型的二元交叉熵准确率未发生变化

我在网上看到了很多关于这个问题的提问,但没有找到明确的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注