错误反向传播算法中的学习率递减

这是一个比较普遍的问题,在我实现的反向传播算法中,我从…

如何计算最佳批量大小?

有时候我会遇到一个问题: OOM when alloc…

逻辑回归的MLE对数似然函数导致除以零错误

我想计算逻辑回归模型的对数似然函数。 def sigm…

ValueError: 没有可优化的变量

我正在尝试计算两张图像之间的l2_loss并获取它们的…

TensorFlow中GradientDescentOptimizer和AdamOptimizer的区别?

当使用GradientDescentOptimizer…

理解使用梯度下降法的逻辑回归代码

我一直在关注Siraj Raval关于使用梯度下降法的…

反向传播 – 梯度误差 [Python]

我正在学习Andrew Ng的新深度学习Courser…

在Caffe中创建新层

我使用caffe进行深度学习。要为caffe创建一个新…

理解Caffe库

我在深度学习中使用Caffe库。 我对库的运作方式有些…

为什么多层感知机的成本函数会变平?

我刚开始学习机器学习,正在尝试实现一个多层感知机(ML…

### 逻辑回归的泛化问题

根据Andrew Ng在Coursera上的逻辑回归讲…

如何获取或查看xgboost的梯度统计值?

我正在学习xgboost,并且对梯度提升是新手。在梯度…

简单线性回归在TensorFlow中未能收敛

我刚开始学习机器学习和TensorFlow。目前我正在…

实现随机梯度下降的Python代码

我一直在尝试在推荐系统中实现随机梯度下降,遵循以下方程…

tensorflow线性回归误差激增

我正在尝试使用tensorflow拟合一个非常简单的线…

随机梯度下降的成本函数是针对所有行计算的还是仅针对迭代的行计算?

在随机梯度下降中,我想了解的是在转到下一行之前更新参数…

L1范数与L2范数作为标准化时的成本函数

我有一些数据,其中输入和输出值都已经标准化,因此Y和Y…

线性回归中的梯度下降不收敛

我在JavaScript中实现了一个非常简单的线性回归…

Java实现多元梯度下降算法

我在尝试用Java实现多元梯度下降算法(来自AI Co…

随机梯度下降收敛得太平滑了

作为我的家庭作业的一部分,我被要求实现随机梯度下降来解…

多标签分类中汉明损失的梯度计算

我正在使用某种循环神经网络结构进行多标签分类。我的问题…

梯度下降 – 步长值

设 k = alpha * partial_deriv…

多臂老虎机练习中的违反直觉的结果

我正在学习Sutton & Barto的《强化…

线性回归梯度下降实现问题

我正在参加Coursera上的这门课程,学习机器学习/…

在Python中对对数下降曲线进行梯度下降

我想对如下所示的对数下降曲线进行梯度下降: y = y…