我有一个从RGB图像样本中训练的模型,该模型以31×31像素区域作为输入,并为中心像素生成一个分类结果。
我想将这个模型应用于整张图像,以便有效地恢复每个像素的分类新图像。由于这不是卷积,我不确定在TensorFlow中这样做的首选方法是什么。
我知道可以通过将图像分解成许多小的张量来进行推断,但这样做似乎是巨大的浪费,因为每个像素会被复制961次。有没有办法避免这种情况?
回答:
将您的模型改造成一个全卷积
神经网络,这样对于31x31
的图像,它将生成一个单一标签
,而对于62x62
的图像,它将生成2x2
的标签,依此类推。这将消除您在窗口方法中提到的冗余计算问题。
如果网络中有一个全连接层,可以用1x1
核的卷积层来替换它。