我想使用Caffe及其自带的GoogLeNet结构,基于我自己的图像数据来训练模型。我有14个分类用于分类。但是我只有大约250张图像用于训练,80张用于测试。这够吗?有什么方法可以确定每个类别需要多少图像?
回答:
解决方案1:由于您的数据量非常少,只需微调顶层。这样,您可以将网络视为特征提取器,然后在这些特征之上训练一个分类器。
解决方案2:尝试激进的数据增强。例如,您可以尝试对数据进行随机平移、缩放、旋转。通过这种方式,您可以从一张训练图像中获得大量图像。
解决方案3:最有效的方法是尽量获取更多真实数据。数据对深度学习非常重要。根据经验,每个类别至少需要1000张图像。