我正在尝试开始学习CNN的设计,我找到了一段代码,并试图从中推断出设计(特征图大小、步长等)。
我理解的是,我们有:输入 –> Conv5-32 –> 最大池化 –> Conv5-5 –> 最大池化 –> 全连接层1 –> 输出。
我不明白的是全连接层1的输入,为什么是7×7?
请有人能帮助我吗?(我是初学者)
回答:
这是因为最大池化操作。每一次最大池化都会将输入在每个维度上的大小缩小一半。
所以在第一次最大池化后,你的28×28图像变成了14×14,第二次后变成了7×7。
我正在尝试开始学习CNN的设计,我找到了一段代码,并试图从中推断出设计(特征图大小、步长等)。
我理解的是,我们有:输入 –> Conv5-32 –> 最大池化 –> Conv5-5 –> 最大池化 –> 全连接层1 –> 输出。
我不明白的是全连接层1的输入,为什么是7×7?
请有人能帮助我吗?(我是初学者)
回答:
这是因为最大池化操作。每一次最大池化都会将输入在每个维度上的大小缩小一半。
所以在第一次最大池化后,你的28×28图像变成了14×14,第二次后变成了7×7。