Home IT技术为什么扩张卷积能保持分辨率？

为什么扩张卷积能保持分辨率？

IT技术 xiaolong · 2025年4月13日 · 0 Comment

动画来自这里。我想知道为什么扩张卷积被声称能保持分辨率。显然，蓝色的输入是7×7，而绿色的输出是3×3。

编辑：

一种解决分辨率损失的方法是用大约当前感受野一半大小的填充来填充输入，但是

这实质上削弱了扩张卷积不会损失分辨率的说法，因为是填充在保持分辨率。要获得与输入相同大小的输出，传统卷积需要更少的填充。
由于填充呈指数增长，相对不小的扩张因子会导致输入图像被大量填充。想象一个1024×1024的输入使用10倍扩张，它将变成大约2048×2048（如果我在这里错了请告诉我）。这相当于原始大小的4倍，这意味着大多数卷积是在填充区域而不是真实输入上进行的。个人认为这相当违反直觉。

回答：

这确实是一个使用5×5滤波器的扩张卷积。如果你把动画中的蓝色部分想象成一个0填充的3×3图像，它确实保持了分辨率。

关于你的编辑，重点在于你链接的帖子中的这句话：扩张卷积支持感受野的指数扩展，同时不损失分辨率或覆盖范围

填充是为了保持分辨率。这是正确的。

我们真正想要的是扩展感受野的大小。在你链接的帖子中，通过使用逐渐增加的扩张率的3个3×3扩张卷积，我们已经在特征图中实现了15×15的感受野。

要用3×3卷积实现等效的效果，并且不损失覆盖范围和不损失分辨率，我们可以使用步长3（4会导致覆盖范围损失）并进行极重的填充（就像你说的，大部分是填充的零的卷积）。然而，我们需要4个步长为3的3×3卷积而不是3个来实现15×15的感受野。

除此之外，普通卷积会有更多不合理的卷积，与扩张卷积的情况相比。

computer-vision convolution machine-learning

发表回复取消回复