矢量化梯度下降算法

我在Matlab中编写梯度下降算法。对于两个特征，我在更新步骤中得到以下代码：

temp0 = theta(1,1) - (alpha/m)*sum((X*theta-y).*X(:,1));temp1 = theta(2,1) - (alpha/m)*sum((X*theta-y).*X(:,2));theta(1,1) = temp0;theta(2,1) = temp1;

然而，我希望将这段代码矢量化，并能够将其应用于任意数量的特征。对于矢量化部分，资料显示我尝试做的是矩阵乘法

theta = theta - (alpha/m) * (X' * (X*theta-y));

这看起来不错，但当我尝试时，我意识到它对梯度下降不起作用，因为参数不是同时更新的。

那么，我该如何矢量化这段代码，并确保参数同时更新呢？

回答：

你的矢量化是正确的。我也尝试了你的两种代码，结果得到了相同的theta。只要记住，在你的第二种实现中不要使用更新后的theta。

这也可行，但不如你的第二种实现简洁：

Error = X * theta - y;for i = 1:2    S(i) = sum(Error.*X(:,i));endtheta = theta - alpha * (1/m) * S'

学技术

矢量化梯度下降算法

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复