如何确保Caffe分割网络的输出尺寸与输入一致？

我正在训练一个使用U-net架构的分割模型。输入图像尺寸为250×250。

目前，我已经手动调整了一些卷积层的填充，以确保模型输出与输入尺寸相同，即250×250。

但是，当我输入不同尺寸的图像，例如500×500时，输出尺寸变成了506×506。

如何确保无论输入尺寸如何，输出尺寸都与输入保持一致？

回答：

您可以使用"Crop"层来强制输出形状与输入相同。
对于U-net，我建议在每次上采样后都使用裁剪层，而不仅仅是在最后，以避免累积填充误差。

关于“填充误差”：
假设您有一个100×100的输入形状，您将其下采样3次，每次缩小2倍，最终得到13×13的特征图。
现在，如果您上采样三次，每次放大2倍

13x13 --> 26x26 --> 52x52 --> 104x104

您会发现由于填充/四舍五入增加了“额外”的4个像素（在您的问题中是6个）。
然而，如果您在每次上采样后都使用"Crop"

13x13 --> 26x26 \crop 25x25 --> 50x50 --> 100x100

您会发现只有在第一次上采样后才需要进行非平凡的裁剪，并且在那个层次上只有1个像素误差，而不是4个。

学技术