例如,使用9×9滤波器生成输出,并将该输出作为MLP的输入,具体执行了什么操作?
回答:
在最后一个卷积层之后,你会有N
个特征图,分辨率为WxH
。如果你将所有值连接起来,这可以被视为一个大小为NxWxH
的特征向量X
。
这就是你如何将其连接
到MLP的方式:即X
作为一个线性变换的输入,其行数等于MLP的输出,列数等于NxWxH
。
示例:一个简单的包含2个卷积层的卷积网络用于交通标志识别,其结构如下:
- 输入:3个通道,宽度=32,高度=32
- 层1:108个特征图,宽度=14,高度=14
- 层2:200个特征图,宽度=5,高度=5
- 2层分类器,包含100个隐藏单元和43个输出类别
因此,要将其连接到最终的MLP,你需要将层2的输出重塑
成一个包含200x5x5=5000个元素的向量。
这个向量成为一个大小为100(行)x 5000(列)的线性变换的输入。
(x) 卷积核大小 = 5,空间池化大小 = 2。