如何确保Caffe分割网络的输出尺寸与输入一致?

我正在训练一个使用U-net架构的分割模型。输入图像尺寸为250×250。

目前,我已经手动调整了一些卷积层的填充,以确保模型输出与输入尺寸相同,即250×250。

但是,当我输入不同尺寸的图像,例如500×500时,输出尺寸变成了506×506。

如何确保无论输入尺寸如何,输出尺寸都与输入保持一致?


回答:

您可以使用"Crop"层来强制输出形状与输入相同。
对于U-net,我建议在每次上采样后都使用裁剪层,而不仅仅是在最后,以避免累积填充误差。

关于“填充误差”:
假设您有一个100×100的输入形状,您将其下采样3次,每次缩小2倍,最终得到13×13的特征图。
现在,如果您上采样三次,每次放大2倍

13x13 --> 26x26 --> 52x52 --> 104x104

您会发现由于填充/四舍五入增加了“额外”的4个像素(在您的问题中是6个)。
然而,如果您在每次上采样后都使用"Crop"

13x13 --> 26x26 \crop 25x25 --> 50x50 --> 100x100

您会发现只有在第一次上采样后才需要进行非平凡的裁剪,并且在那个层次上只有1个像素误差,而不是4个。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注