在这个教程中,输出体积在输出[25]中给出,感受野在输出[26]中指定。
好的,输入体积[3, 227, 227]
与大小为[3, 11, 11]
的区域进行卷积运算。
使用这个公式 (W−F+2P)/S+1
,其中:W
= 输入体积大小F
= 感受野大小P
= 填充S
= 步长
…结果是(227 - 11)/4 + 1 = 55
,即[55*55*96]。到目前为止一切顺利 🙂
对于’pool1’,他们使用了F=3
和S=2
,我想?计算结果是正确的:55-3/2+1=27
。
从这里开始我有点困惑。第二层卷积网络的感受野是[48, 5, 5]
,然而’conv2’的输出等于[256, 27, 27]
。这里发生了什么计算?
然后,’conv3’到’conv4’的输出体积的高度和宽度都是相同的[13, 13]
?这是怎么回事?
谢谢!
回答:
如果你仔细查看conv2
层的参数,你会注意到
pad: 2
也就是说,输入blob在周围增加了2个额外的像素,因此公式现在是
27 + 2 + 2 - ( 5 - 1 ) = 27
将大小为5
的内核在两侧各填充2
个像素,会得到相同的输出大小。