通常,我们设置输入图像的’高度’、’宽度’和’通道’。
在’通道’中,我们为灰度图像设置1,为RGB图像设置3。
我的问题是,这些通道是否应该使用同一张图片?如上所述。
还是我可以将一系列图像设置为通道?
(例如,我在某一时刻有10张空间上离散的图像,所以我将通道设置为10作为一个输入)
这样做会有什么问题吗?这是正确的做法吗?
还是我应该为这10张图像设置10个输入?
感谢您的回答!
回答:
不,这不会相同,因为输入层的通道数决定了卷积滤波器的形状,从而决定了参数的数量以及它们如何应用。
比较这两个卷积网络:
[32x32x3]
输入形状,batch_size=5
,5x5
感受野,那么卷积层中的每个神经元将具有权重到输入体中的一个[5x5x3]
区域,总共有5*5*3 = 75
个权重(再加上1个偏置参数)。[32x32x15]
输入形状,batch_size=1
,相同的5x5
感受野,那么每个神经元将具有权重到一个[5x5x15]
区域,总共有5*5*15 = 325
个权重(同样加上1个偏置参数)。
在这两种情况下,两个卷积层都看到了15张RGB图像,但第二个网络将使用5倍的参数来学习相同的数据,而第一个网络将为不同的图像重用相同的参数。还要注意,第二个网络将为每张第一张图像、每张第二张图像等分配专用的参数。
显然,第一个方法更好,不仅因为它节省了资源,而且它对批次中训练图像的顺序不变。