在深度CNN任务中,我明白有时像高斯滤波和裁剪这样的图像预处理技术对深度CNN建模是有帮助的。我想知道这些技术是否也可以应用于测试数据。我一直认为测试数据不应该被触碰,以便准确评估模型性能。
回答:
事实上,你确实需要将训练数据上使用的那些滤波器也应用到测试数据上!
不触碰测试数据的说法,指的是在训练过程中不使用它们,这样泛化只在训练数据上进行,因此当你在测试数据上进行评估时,你能得到模型的真实性能和质量。
任何在训练数据上应用的过滤,如高斯滤波,在注入模型训练之前,也应该在测试数据上进行。
对于裁剪,具体要看你是如何裁剪的,以及裁剪的内容。如果你的照片总是带有边框,并且在训练数据集中你通过裁剪去除了这些边框,我强烈建议在测试数据上也这样做。