Home IT技术 为什么学习率有时被称为alpha? 为什么学习率有时被称为alpha? IT技术 xiaolong · 2025年5月28日 · 0 Comment 在查看多种代码时,我发现有些人将学习率称为“alpha”。这种称呼的起源是什么?这是常见的吗? 回答: 在梯度下降算法中,参数/权重的更新规则是 即我们取梯度的一个小值(倍数)并调整当前参数的值。我们所取的梯度量是由alpha决定的。alpha越大,所考虑的当前梯度部分就越大;alpha越小,所考虑的梯度就越小。 这个alpha被称为学习率,因为alpha越高,我们移动得越快;alpha越低,移动得越慢。 相关文章: 能量函数和损失函数有什么区别? 为什么我们称CNN中的全连接层为“顶层”? 什么是“学习率预热”? 什么是“文本退化”? 在OpenCV或类似库中是否有卷积神经网络的实现? 在C++或Python中与Caffe交互时遇到的问题 如何从头开始创建和格式化用于机器学习的图像数据集? 运行Google的深度Q网络代码时遇到错误 Theano/Lasagne/Nolearn 神经网络图像输入 深度学习涉及哪些算法? deep-learning machine-learning terminology