我有一个类,它与其他类有一些细微的不同特征:例如 – 这张图片上有扣环(可以认为它是一个类) https://6c819239693cc4960b69-cc9b957bf963b53239339d3141093094.ssl.cf3.rackcdn.com/1000006329245-822018-Black-Black-1000006329245-822018_01-345.jpg
但是,这张图片与它非常相似,但没有扣环: https://sc01.alicdn.com/kf/HTB1ASpYSVXXXXbdXpXXq6xXFXXXR/latest-modern-classic-chappal-slippers-for-men.jpg
我对在这种情况下使用哪种模型感到有点困惑,这种模型实际上是学习像素到像素的值的。
任何想法都会受到欢迎。谢谢!!
我已经尝试过Inception、Resnet等模型。
在每个类别只有少量训练数据(每个类别大约300-400个)的情况下,我们能否达到较好的召回率/精确度/F1分数。
回答:
由于数据集较小,你可能需要考虑使用迁移学习。你可以使用一个转移过的ResNet模型作为特征提取器,并尝试在其上应用YOLO(你只看一次)算法,通过滑动窗口(查看使用卷积网络的滑动窗口实现)来检测每个窗口中的腰带扣环,并据此对图像进行分类。
根据我对你的数据集的理解,要采用上述方法,你需要重新标注数据集以满足YOLO算法的要求。
要查看上述方法的一个例子,请访问 https://mc.ai/implementing-yolo-using-resnet-as-feature-extractor/
编辑 如果你有XML标注的数据集,并且需要将其转换为csv以遵循上述示例,请使用 https://github.com/datitran/raccoon_dataset
祝你建模愉快。