我有一大组不同形状、大小、光照、颜色等的“苹果”图像。这些“苹果”图像是从不同角度的更大图像中裁剪出来的。
现在我想训练Darknet来检测图像中的“苹果”。我不想经历标注过程,因为我已经有了裁剪好的苹果jpg图像。
我可以使用这些已裁剪好的“苹果”图像来训练Darknet,还是仍然需要经历标注过程?
回答:
在对象检测模型中,我们标注图像中的对象,因为它需要理解对象在特定图像中的位置。如果你有一个只包含苹果图像的完整数据集,模型将以一种方式学习,即你提供的每张图像都只包含苹果。因此,即使你提供了一个“橙子”作为测试图像,它也可能会识别为苹果,因为它不知道苹果之外的其他类别。
因此,有两点需要考虑:
- 确保数据集包含苹果、苹果与其他水果或其他对象。这将帮助模型清楚地理解什么是苹果。
- 由于边界框的坐标是检测的输入,尽管你可以将图像的常规尺寸作为边界框,但如上所述,它不会有效地学习。因此,图像中应包含多个对象,并进行良好的标注,以便模型能够很好地学习。