我想训练一个三类别的组织图像分类器,但总共只有大约50张标注过的图像。我不能从图像中提取patches来进行训练,所以我在寻找其他解决这个问题的方法。
谁能建议一个方法吗?提前感谢你们。
回答:
这个问题非常广泛,但这里有一些建议:
- 生成输入图像的变体可能是合理的。比如修改对比度、亮度或颜色,旋转图像,添加噪声。但这些操作是否合理,实际上取决于分类问题的类型。
- 一般来说,数据越少,模型应该具有的参数(如权重等)就越少。否则会导致过度学习,意味着你的分类器只能对训练数据进行分类,而无法处理其他数据。
- 你应该检查是否存在过度学习。一个简单的方法是将你的训练数据分成训练集和控制集。一旦你发现分类对控制集也正确,你可以包括控制集进行额外的训练。