我可以将多个不同的图像设置为通道吗?

通常,我们设置输入图像的’高度’、’宽度’和’通道’。

在’通道’中,我们为灰度图像设置1,为RGB图像设置3。

我的问题是,这些通道是否应该使用同一张图片?如上所述。

还是我可以将一系列图像设置为通道?

(例如,我在某一时刻有10张空间上离散的图像,所以我将通道设置为10作为一个输入)

这样做会有什么问题吗?这是正确的做法吗?

还是我应该为这10张图像设置10个输入?

感谢您的回答!


回答:

不,这不会相同,因为输入层的通道数决定了卷积滤波器的形状,从而决定了参数的数量以及它们如何应用。

比较这两个卷积网络:

  • [32x32x3] 输入形状,batch_size=55x5 感受野,那么卷积层中的每个神经元将具有权重到输入体中的一个 [5x5x3] 区域,总共有 5*5*3 = 75 个权重(再加上1个偏置参数)。
  • [32x32x15] 输入形状,batch_size=1,相同的 5x5 感受野,那么每个神经元将具有权重到一个 [5x5x15] 区域,总共有 5*5*15 = 325 个权重(同样加上1个偏置参数)。

在这两种情况下,两个卷积层都看到了15张RGB图像,但第二个网络将使用5倍的参数来学习相同的数据,而第一个网络将为不同的图像重用相同的参数。还要注意,第二个网络将为每张第一张图像、每张第二张图像等分配专用的参数。

显然,第一个方法更好,不仅因为它节省了资源,而且它对批次中训练图像的顺序不变。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注