在阅读了卷积神经网络(LeNet)后,我部分理解了最大池化:
CNN的另一个重要概念是最大池化,这是一种非线性降采样的形式。最大池化将输入图像划分为一组不重叠的矩形,并对每个这样的子区域输出最大值。
那总和池化呢?我找不到任何易于理解的文章。
回答:
卷积神经网络在处理高维数据方面表现出色。仅将权重限制在核权重上,由于图像或声音的不变性特性,使得学习变得更容易。但如果你仔细观察正在发生的事情,你可能会注意到,如果不使用像池化这样的技巧,在第一层卷积层之后,你的数据维度可能会显著增加。
最大池化通过仅从卷积层的固定区域中取最大输入来简单地减少数据的维度。总和池化以类似的方式工作——通过取输入的总和而不是其最大值。
这些方法之间的概念差异在于它们能够捕捉到的不变性类型。最大池化对池化区域中某些模式的存在敏感。总和池化(与平均池化成比例)测量给定区域中模式存在的平均值。
更新:
总和池化/平均池化的子区域设置与最大池化完全相同,但不是使用max函数,而是使用sum/mean。你可以在这里的关于池化的段落中阅读这里。