我想使用TensorFlow和CNN来制作一个蘑菇分类器。但是,我对图像数据的预处理有些疑问。我应该将图片背景去除并设为黑色,还是直接使用原始图片?
另外,如果在CNN之前有任何预处理步骤,请告诉我。
回答:
这个问题有点宽泛,但我会给你一个提示。
我应该将图片背景去除并设为黑色,还是直接使用原始图片?
如果你能做到这一点,通过数据增强可以获得更高的准确性,因为你可以生成具有不同背景的训练图像,从而帮助模型泛化。
然而,请注意,仅仅去除背景,神经网络可能会“习惯”于黑色背景,因此你也需要对测试图像进行转换,这反过来又需要图像分割。
由于图像分割比分类还要困难,通常背景是保持不变的。
另外,如果在CNN之前有任何预处理步骤,请告诉我。
对于所有图像相关任务都有效的预处理步骤是零中心化:计算训练集的平均值,并使用该值来对图像进行零中心化。注意在计算平均值时不要使用测试图像。