我正在进行一个年龄分类项目。在创建基于年龄组的类别时,不同年龄组的图像数量不同。一个年龄组只有大约1100张图片,而另一个则有大约4500张。我知道1100张图片对于一个类别来说是不够的。我该如何增加数据较少的那个类别的数据量?有没有方法可以制造出高质量的数据样本?
回答:
我想你是从面部图像开始工作的。为了对这些图像进行数据增强,你可以:
- 稍微旋转图像,
- 稍微修改倾斜和倾斜度,
- 稍微裁剪,
- 左右翻转,
- 添加噪声(如椒盐噪声、高斯噪声等),
- 改变亮度。
当然,你还可以将上述两种或多种处理方法混合使用。例如,参考 imgaug。
如果投入更多工作,你可以尝试在图像上进行风格迁移,或者使用GANs对图像进行修改。参考 这篇论文