我想这可能是个愚蠢的问题?但我想知道的是,在卷积神经网络中,最终我们会将一个二维矩阵展平为一个单列向量,以便将其输入到前馈神经网络中,那么在这一点上我们不是会丢失像素的空间信息吗?任何指导都将不胜感激,谢谢你。
回答:
不,当你从卷积层过渡到全连接层时,你不会丢失空间信息。考虑一个简单的例子,一个2×2的滤波器用于一个没有填充的2×3灰度图像。这将产生一个1×2的结果。
假设有两类图像。一类总是看起来像这样:
1 0 01 0 0
另一类总是看起来像这样:
0 1 00 1 0
一个可能被学习到的用于区分这两类图像的滤波器可能看起来像这样:
.5 0.5 0
这个滤波器简单地平均了空间区域左半部分的值,对于第一类图像会产生[1 0]
,对于第二类图像会产生[0 1]
。显然,这种纯粹的空间信息可以很容易地被具有softmax激活的全连接层用于分类。
事实上,这个滤波器为任何2xN的图像提供其空间信息作为一个一维向量,因此应该清楚,仅仅从二维向量转换为一维向量并不一定会丢失空间信息。这取决于这些一维向量是如何生成的。