需要帮助设置神经网络参数（学习率、动量、隐藏层大小…）

我有一个标准的前馈反向传播神经网络，我希望训练它能够识别蓝色球。我有30张图片，其中20张是球的图片，10张没有球，我的第一个问题是这些图片是否足够，我假设多比少好，但我想知道是否有某种最低要求。每张图片的宽度为96像素，高度为128像素，总共12,288像素，乘以3（RGB），因此我的输入层有36,864个感知器。由于我只需要知道图片是否包含蓝色球，因此我有一个输出感知器。网络中的所有感知器都使用逻辑激活函数。在我的隐藏层中，我尝试了从100到3000的不同数量的隐藏单元，但似乎都没有效果，网络要么在第一轮迭代后就说MSE足够低而停止，要么因为训练迭代限制而从未达到期望的MSE，并且输出始终是相同的值，无论输入是什么。我尝试了一系列学习率和动量，所有值都在0.1以下，且动量始终小于学习率，我当前的目标MSE是0.0005。我之前使用神经网络进行过对象检测，但没有使用输入层，我只有一个包含12,288个感知器的隐藏层（每个像素一个），每个感知器有24个输入（每种颜色8位，3*8=24位），接收来自图像的二进制颜色信息，然后我有一个输出感知器，所有感知器都使用逻辑激活函数，并且它有效。我以为我可以尝试使用输入层，但到目前为止，我唯一能学会的是XOR问题。

所以我的问题是：

对于我的问题，最佳的网络拓扑结构是什么？（多少层，隐藏单元…）

我应该使用什么范围的学习率和动量值？

30个训练样本是否足够？

作为补充说明，如果这有关系的话，当我的神经网络创建时，权重被初始化为-0.3到0.3之间的值

回答：

总的来说，我认为神经网络的最大问题是事先没有好的保证，而且在结构上有很大的自由度。选择正确的参数需要进行大量的实验和反复尝试。

我认为没有人能事先告诉你什么肯定会有效。

学技术

需要帮助设置神经网络参数（学习率、动量、隐藏层大小…）

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复