Home IT技术用于捕捉图像中微小特征的深度学习模型是哪一种？

用于捕捉图像中微小特征的深度学习模型是哪一种？

IT技术 xiaolong · 2025年5月22日 · 0 Comment

我有一个类，它与其他类有一些细微的不同特征：例如 – 这张图片上有扣环（可以认为它是一个类） https://6c819239693cc4960b69-cc9b957bf963b53239339d3141093094.ssl.cf3.rackcdn.com/1000006329245-822018-Black-Black-1000006329245-822018_01-345.jpg

但是，这张图片与它非常相似，但没有扣环： https://sc01.alicdn.com/kf/HTB1ASpYSVXXXXbdXpXXq6xXFXXXR/latest-modern-classic-chappal-slippers-for-men.jpg

我对在这种情况下使用哪种模型感到有点困惑，这种模型实际上是学习像素到像素的值的。

任何想法都会受到欢迎。谢谢！！

我已经尝试过Inception、Resnet等模型。

在每个类别只有少量训练数据（每个类别大约300-400个）的情况下，我们能否达到较好的召回率/精确度/F1分数。

回答：

由于数据集较小，你可能需要考虑使用迁移学习。你可以使用一个转移过的ResNet模型作为特征提取器，并尝试在其上应用YOLO（你只看一次）算法，通过滑动窗口（查看使用卷积网络的滑动窗口实现）来检测每个窗口中的腰带扣环，并据此对图像进行分类。

根据我对你的数据集的理解，要采用上述方法，你需要重新标注数据集以满足YOLO算法的要求。

要查看上述方法的一个例子，请访问 https://mc.ai/implementing-yolo-using-resnet-as-feature-extractor/

编辑如果你有XML标注的数据集，并且需要将其转换为csv以遵循上述示例，请使用 https://github.com/datitran/raccoon_dataset

祝你建模愉快。

computer-vision deep-learning machine-learning transfer-learning

发表回复取消回复