假设我们不仅有一张图片,还有从左到右的X轴梯度和从上到下的Y轴梯度。这两个梯度与图片大小相同,数值范围从-0.5到0.5。
现在,我想让卷积核(也称为卷积滤波器或卷积权重)依赖于梯度中的(x, y)
位置。也就是说,卷积核是梯度的函数,就好像卷积核是嵌套迷你神经网络的输出。这将使得滤波器的权重在每个位置都不同,但与其邻居略有相似。我如何在PyTorch或TensorFlow中实现这一点呢?
当然,我可以自己计算一个Toeplitz矩阵(也称为对角常数矩阵),但如果假设x==y==n
,矩阵乘法将需要O(n^3)
次操作,而卷积通常可以以O(n^2)
实现。或者我可以自己迭代每个元素,并以非向量化的方式进行乘法运算。
有什么更好的想法吗?我希望在这里看到创意,思考如何整洁地实现这一点。我认为这样编码将是一种有趣的方式来构建一个网络层,能够做类似于空间变换网络简化版本的事情,但其空间变换将独立于图像。
回答:
以下是我为此问题的简化版本想到的一个解决方案,其中使用权重的线性组合,而不是真正使用嵌套迷你神经网络:
可以进行4次不同的卷积传递,以获得4个特征图,然后将这些图与梯度(2个垂直和2个水平梯度)相乘,并将它们加在一起,使得只剩下1个图。然而,这将是不同图的线性组合,比真正使用嵌套神经网络(首先会改变卷积核)更简单。