用于捕捉图像中微小特征的深度学习模型是哪一种?

我有一个类,它与其他类有一些细微的不同特征:例如 – 这张图片上有扣环(可以认为它是一个类) https://6c819239693cc4960b69-cc9b957bf963b53239339d3141093094.ssl.cf3.rackcdn.com/1000006329245-822018-Black-Black-1000006329245-822018_01-345.jpg

但是,这张图片与它非常相似,但没有扣环: https://sc01.alicdn.com/kf/HTB1ASpYSVXXXXbdXpXXq6xXFXXXR/latest-modern-classic-chappal-slippers-for-men.jpg

我对在这种情况下使用哪种模型感到有点困惑,这种模型实际上是学习像素到像素的值的。

任何想法都会受到欢迎。谢谢!!

我已经尝试过Inception、Resnet等模型。

在每个类别只有少量训练数据(每个类别大约300-400个)的情况下,我们能否达到较好的召回率/精确度/F1分数。


回答:

由于数据集较小,你可能需要考虑使用迁移学习。你可以使用一个转移过的ResNet模型作为特征提取器,并尝试在其上应用YOLO(你只看一次)算法,通过滑动窗口(查看使用卷积网络的滑动窗口实现)来检测每个窗口中的腰带扣环,并据此对图像进行分类。

根据我对你的数据集的理解,要采用上述方法,你需要重新标注数据集以满足YOLO算法的要求。

要查看上述方法的一个例子,请访问 https://mc.ai/implementing-yolo-using-resnet-as-feature-extractor/

编辑 如果你有XML标注的数据集,并且需要将其转换为csv以遵循上述示例,请使用 https://github.com/datitran/raccoon_dataset

祝你建模愉快。

Related Posts

多维度Top-k评分

例如,在机器学习中的自然语言处理中,通常使用波束搜索来…

R – Caret train() “错误:停止” 与 “在newdata中未找到对象中使用的所有变量名”

我正在尝试为蘑菇数据构建一个简单的朴素贝叶斯分类器。我…

创建训练和测试数据集分割,数据嵌套在多个文件夹中

我正在准备数据以训练一个图像识别模型。目前我有一个文件…

我的神经网络预测出现错误:IndexError: list index out of range

我正在进行一个简单的垃圾邮件/非垃圾邮件文本分类。我的…

python 给出数组是一维的,但索引了两个维度错误

我已经为 miniBatchGradientDesce…

TensorFlow自定义训练步骤使用不同的损失函数

背景 根据TensorFlow文档,可以使用以下方式执…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注