我是 Tensorflow 的新手,找不到我问题的答案。
我正在尝试编写一个简单的程序,用于识别图片中的货车类型。我从每个类别下载了大约100张图片作为我的数据集。
我的问题是,我是否应该裁剪图片,使图片上只显示货车?
还是应该使用带有背景的原始图片以获得更好的准确性?
回答:
简短的回答是肯定的,但这个问题需要考虑更多因素。例如,使用这个模型时,图像会是什么样子?是有人手动裁剪这些图像然后使用模型,还是有人通过手机应用拍摄这些照片?机器学习的一个核心概念是,生产环境中的图像应尽可能接近训练数据,这样在生产中的表现就不会发生变化。
如果你只是想学习,我强烈建议你先尝试在 MNIST 或 乐高积木数据集上构建网络,然后再尝试使用你自己的图像,因为如果你在其中任何一个上遇到困难,有很多很好的资源可用 :)。此外,考虑将10张图片留作 测试集,以便你可以评估模型的性能。第三,Tensorflow 有一个内置的 图像数据集生成器,它将大大提高像这样的小数据集的模型性能。TensorFlow 图像数据集生成器可以缩放、旋转、翻转和放大你的图像,这将大大提高模型的准确性。
祝你好运!