假设我有一个尺寸为125 * 125的RGB图像,并使用10个尺寸为5 * 5的滤波器,步长为3,那么这一层的特征图是什么?参数总数是多少?
我对特征图的猜测是:10*((125-5)/3)+1 = (41 * 41 * 10)(滤波器数量),但RGB图像和灰度图像有什么区别?对于RGB图像,应该是41 * 41 * 30(滤波器数量 * 输入图像的通道数)?而参数总数是:5 * 5 * 3 * 10=750?
回答:
特征图的数量等于滤波器的数量,每个特征图的大小将是41 * 41(如果你计算正确,且填充为零)。所以,在上述情况下,如果你有10个滤波器,你将得到10个大小为41 * 41的特征图,这与RGB或灰度图像无关。
对于RGB和灰度图像,考虑通道就像输入层的特征图,滤波器会一次性应用于所有特征图。如果你有一个输入的RGB图像,滤波器大小为5 * 5,实际上它是一个大小为5 * 5 * 3(通道数)的滤波器。因此,无论是RGB还是灰度,如果你在一个大小为125 * 125的图像上应用10个5*5的滤波器,步长为3,你总是会得到10个大小为41 * 41的特征图。
每当你定义一个滤波器时,它被定义为x * y,但z总是等于’你应用卷积的通道数’,对于2D卷积而言。这样,每个滤波器的总参数数将是x * y * n_channels + 1(额外的1是常数项)。
在你的10个滤波器的情况下,对于RGB图像,每个滤波器的大小为5 * 5 * 3。因此,RGB的总参数数为10 * (5 * 5 * 3 + 1)。而对于灰度图像,每个滤波器为5 * 5 * 1。因此,灰度的总参数数为10 * (5 * 5 * 1 + 1)。