我的问题是关于每个卷积层后特征图的数量。根据我的学习,在每个卷积层中,基于我们所需的滤波器,我们会得到相应数量的特征图。但在一些教程中,我遇到了某些架构并不遵循这一规则。例如,在这个例子中:
第一个卷积层经过池化后的输出是6个特征图(红色线)。使用这些特征图在下一层的卷积中,产生了16个新的特征图(绿色线),这是怎么做到的呢?之前层级的每个特征图应该生成1,2,3…个新特征图,我们不应该在下一层得到16个新特征图。这怎么发生的?我的假设不对吗?
回答:
第二个卷积层的工作原理如下:
- 输入矩阵形状:6@14×14(6个通道 – 这是前一个(第一个)卷积步骤应用6个滤波器的结果)
- 6@14×14的输入矩阵将使用16个滤波器进行卷积(每个滤波器应有6个通道以匹配输入矩阵的通道数)
- 这将产生16@5×5的输出矩阵
注意:输入矩阵的通道数和每个滤波器的通道数必须匹配,以便能够进行逐元素乘法运算。
因此,第一和第二卷积之间的主要区别在于,第一卷积的输入矩阵的通道数是1
,所以我们将使用6
个滤波器,其中每个滤波器只有一个通道(矩阵的深度)。
对于第二卷积,输入矩阵有6个通道(特征图
),因此每个用于此卷积的滤波器也必须有6个通道。例如:每个16个滤波器将具有6@3x3
的形状。
对于一个6@3x3
形状的单个滤波器的卷积步骤的结果将是一个WxH
(宽度,高度)形状的单个通道。在应用所有16个滤波器(每个滤波器的形状为6@3x3
)后,我们将得到16个通道,每个通道是单个滤波器卷积的结果。