特征图在拼接后的情况

我有一个初学者问题,但我无法解决这个问题。

输入图像为512*512。在输入图像上执行了两个独立的操作并进行了拼接:

  1. 步长为2的3*3卷积,具有13个滤波器

  2. 最大池化操作

拼接后结果似乎有16个特征图,我不太确定这是怎么回事?

任何建议、答案或阅读材料都将非常有帮助。


回答:

如果这些层是依次应用的,输出不会有16个特征图,而是13个。但如果它们是并行进行的,如果输入通道数C=3,这是完全可能的。

让我们逐层分析:

  • 输入是(B, 512, 512, 3),其中B是批量大小。
  • 卷积层将此输入张量转换为(B, 256, 256, 13)(B, 255, 255, 13),这取决于使用的填充(参见此问题中的公式:卷积后矩阵大小的计算公式)。
  • 最大池化改变空间维度,就像卷积层一样,但它不改变批量大小和通道数。因此输出将是(B, 256, 256, 3)(B, 255, 255, 3)
  • 假设卷积和最大池化层具有相同的参数,并且拼接是沿着第4轴进行的,拼接结果将是(B, 256, 256, 16)(B, 255, 255, 16),因为16=13+3

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注