卷积神经网络的特征图和参数总数

假设我有一个尺寸为125 * 125的RGB图像,并使用10个尺寸为5 * 5的滤波器,步长为3,那么这一层的特征图是什么?参数总数是多少?
我对特征图的猜测是:10*((125-5)/3)+1 = (41 * 41 * 10)(滤波器数量),但RGB图像和灰度图像有什么区别?对于RGB图像,应该是41 * 41 * 30(滤波器数量 * 输入图像的通道数)?而参数总数是:5 * 5 * 3 * 10=750?


回答:

特征图的数量等于滤波器的数量,每个特征图的大小将是41 * 41(如果你计算正确,且填充为零)。所以,在上述情况下,如果你有10个滤波器,你将得到10个大小为41 * 41的特征图,这与RGB或灰度图像无关。

对于RGB和灰度图像,考虑通道就像输入层的特征图,滤波器会一次性应用于所有特征图。如果你有一个输入的RGB图像,滤波器大小为5 * 5,实际上它是一个大小为5 * 5 * 3(通道数)的滤波器。因此,无论是RGB还是灰度,如果你在一个大小为125 * 125的图像上应用10个5*5的滤波器,步长为3,你总是会得到10个大小为41 * 41的特征图。

每当你定义一个滤波器时,它被定义为x * y,但z总是等于’你应用卷积的通道数’,对于2D卷积而言。这样,每个滤波器的总参数数将是x * y * n_channels + 1(额外的1是常数项)。

在你的10个滤波器的情况下,对于RGB图像,每个滤波器的大小为5 * 5 * 3。因此,RGB的总参数数为10 * (5 * 5 * 3 + 1)。而对于灰度图像,每个滤波器为5 * 5 * 1。因此,灰度的总参数数为10 * (5 * 5 * 1 + 1)。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注