在U-net中,所有层都有激活函数,但上采样层(使用转置卷积完成)似乎没有激活函数。这样做比添加激活函数更有效率的原因是什么?
据我所知,激活函数提供非线性。因此,这个问题实际上是,保持转置卷积的线性而保持常规卷积的非线性有什么好处?在这些层中添加激活函数难道不是最好的选择吗?
我唯一的其他直觉是,或许他们试图让上采样尽可能接近常规的形态插值方法。
回答:
我认为你的解释是正确的:他们只是试图让过程与使用经典插值进行的上采样保持相似,因为这样可以更好地解释架构(同时仍然允许网络有灵活性,可以学习上采样的最佳权重)。一般来说,如果你想增加更多的非线性,你可以在那个层之后加入任何你想要的激活函数(如ReLU),但就我个人经验而言,我认为性能不会有太大变化。