为什么多层感知机的成本函数会变平?

我刚开始学习机器学习,正在尝试实现一个多层感知机(ML…

### 逻辑回归的泛化问题

根据Andrew Ng在Coursera上的逻辑回归讲…

如何获取或查看xgboost的梯度统计值?

我正在学习xgboost,并且对梯度提升是新手。在梯度…

简单线性回归在TensorFlow中未能收敛

我刚开始学习机器学习和TensorFlow。目前我正在…

实现随机梯度下降的Python代码

我一直在尝试在推荐系统中实现随机梯度下降,遵循以下方程…

tensorflow线性回归误差激增

我正在尝试使用tensorflow拟合一个非常简单的线…

随机梯度下降的成本函数是针对所有行计算的还是仅针对迭代的行计算?

在随机梯度下降中,我想了解的是在转到下一行之前更新参数…

L1范数与L2范数作为标准化时的成本函数

我有一些数据,其中输入和输出值都已经标准化,因此Y和Y…

线性回归中的梯度下降不收敛

我在JavaScript中实现了一个非常简单的线性回归…

Java实现多元梯度下降算法

我在尝试用Java实现多元梯度下降算法(来自AI Co…

随机梯度下降收敛得太平滑了

作为我的家庭作业的一部分,我被要求实现随机梯度下降来解…

多标签分类中汉明损失的梯度计算

我正在使用某种循环神经网络结构进行多标签分类。我的问题…

梯度下降 – 步长值

设 k = alpha * partial_deriv…

多臂老虎机练习中的违反直觉的结果

我正在学习Sutton & Barto的《强化…

线性回归梯度下降实现问题

我正在参加Coursera上的这门课程,学习机器学习/…

在Python中对对数下降曲线进行梯度下降

我想对如下所示的对数下降曲线进行梯度下降: y = y…

为什么我在R中用于回归的梯度下降法失败了?

我调整了以下梯度下降算法,用于对存储在data[:,4…

如何在TensorFlow中禁用特定层的动量?

我有一个包含三层隐藏层的neural网络,可以使用“纯…

如何解释带有调试信息的Caffe日志?

在训练过程中遇到困难时(例如nan、损失不收敛等),有…

梯度下降与闭式解 – MATLAB 中不同假设线

我正在编写我在Coursera机器学习课程(MATLA…

使用Python的numpy实现随机梯度下降

我需要使用Python的numpy库来实现随机梯度下降…

Python梯度下降 – 成本持续增加

我在尝试用Python实现梯度下降算法,但每次迭代我的…

如何在scipy.optimize中使用fmin_cg正确获取维度

我一直在尝试使用fmin_cg来最小化逻辑回归的成本函…

Matlab 正则化逻辑回归 – 如何计算梯度

我目前正在Coursera平台上学习机器学习课程,并且…

如何在Python中实现小批量梯度下降?

我刚开始学习深度学习。当涉及到梯度下降时,我发现自己陷…