在数据增强方面(例如在图像数据集中,创建随机裁剪等),更常见的方法是训练时即时进行,还是创建一个包含增强数据的独立数据集?
回答:
Tensorflow 中最常用的方法是在训练过程中即时创建增强的训练集,对输入图像应用随机变形。
Tensorflow 的作者们甚至在官方 CNN 教程中使用了即时方法:https://www.tensorflow.org/tutorials/deep_cnn#convolutional-neural-networks
特别是,即时增强从这里开始:https://github.com/tensorflow/models/blob/master/tutorials/image/cifar10/cifar10_input.py#L171