增加还是减少学习率来添加神经元或权重?

我修改了一个卷积神经网络的架构。我没有时间重新训练并进行交叉验证(对最佳参数进行网格搜索)。我想直观地调整学习率。

如果以下情况发生,我应该增加还是减少基于SGD的RMS优化器的学习率:

  1. 我在全连接层中添加了更多神经元?
  2. 在卷积神经网络中,我移除了一个子采样层(平均或最大池化)在全连接之前,并且我在该特征图与softmax输出之间增加了全连接单元的数量(因此有更多的权重连接到顶部的全连接神经元)?

回答:

作为一个简短且实用的回答,如果模型更复杂,则降低学习率,变量model_size大约是每层的神经元数量:

def rate(self, step = None):    "Implement `lrate` above"    if step is None:        step = self._step    return self.factor * \        (self.model_size ** (-0.5) *        min(step ** (-0.5), step * self.warmup ** (-1.5)))

来源:The Annotated Transformer

另见:Adam: A Method for Stochastic Optimization

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注