最大池化是一种技术,我在这里读到了它 https://computersciencewiki.org/index.php/Max-pooling_/_Pooling。我理解,它被用来近似输入。这是为了减少神经网络可能花在处理上的时间。我无法确定的问题是,为什么它应该选择最大值?这样有效吗?如果是,为什么?其他的选择可能是选择平均值、最小值,或者可能是左上角的值(例如)。
回答:
我们选择窗口中的最大值以选取最活跃的像素(像素的更多激活意味着更多信息)。
有像平均池化这样的变体来获取窗口中所有像素的平均值,但实际上结果没有太大差异。
最大池化是有效且快速的。使用最大池化而不是平均池化的另一个原因是在反向传播中计算梯度会更快。