如何计算这个Caffe卷积网络示例的输出体积?

在这个教程中,输出体积在输出[25]中给出,感受野在输出[26]中指定。

好的,输入体积[3, 227, 227]与大小为[3, 11, 11]的区域进行卷积运算。

使用这个公式 (W−F+2P)/S+1,其中:
W = 输入体积大小
F = 感受野大小
P = 填充
S = 步长

…结果是(227 - 11)/4 + 1 = 55,即[55*55*96]。到目前为止一切顺利 🙂

对于’pool1’,他们使用了F=3S=2,我想?计算结果是正确的:55-3/2+1=27

从这里开始我有点困惑。第二层卷积网络的感受野是[48, 5, 5],然而’conv2’的输出等于[256, 27, 27]。这里发生了什么计算?

然后,’conv3’到’conv4’的输出体积的高度和宽度都是相同的[13, 13]?这是怎么回事?

谢谢!


回答:

如果你仔细查看conv2层的参数,你会注意到

   pad: 2

也就是说,输入blob在周围增加了2个额外的像素,因此公式现在是

27 + 2 + 2 - ( 5 - 1 ) = 27

将大小为5的内核在两侧各填充2个像素,会得到相同的输出大小。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注