Home IT技术逻辑回归实现

逻辑回归实现

IT技术 xiaolong · 2025年4月13日 · 0 Comment

我在实现逻辑回归时遇到了一些困难，不知道应该如何一步步进行。根据我目前所做的，我是以以下方式实现的：

首先，将theta设为特征的数量，并将其设为一个n*1的零向量。现在使用这个theta来计算以下内容htheta = sigmoid(theta' * X');
theta = theta - (alpha/m) * sum (htheta' - y)'*X
现在使用第一步中计算出的theta来计算成本函数
J= 1/m *((sum(-y*log(htheta))) - (sum((1-y) * log(1 - htheta)))) + lambda/(2*m) * sum(theta).^2
最后计算梯度
grad = (1/m) * sum ((sigmoid(X*theta) - y')*X);

由于我将theta设为零，整个向量的J值相同，这是否是正确的输出？

回答：

你在最后一步计算梯度，但实际上在计算新theta时已经计算过了。此外，你的成本函数定义中包含了正则化参数，但这并未在梯度计算中体现。一个没有正则化的工作版本如下：

% 生成测试用的虚拟数据y=randi(2,[10,1])-1;X=[ones(10,1) randn([10,1])];% 初始化alpha = 0.1;theta = zeros(1,size(X,2));J = NaN(100,1);% 固定次数循环 => 可以通过监测成本函数不再减少来改进htheta = sigmoid(X*theta');for n=1:100    grad = X' * (htheta-y); % 梯度    theta = theta - alpha*grad'; % 更新 theta    htheta = sigmoid(X*theta');    J(n) = sum(-y'*log(htheta)) - sum((1-y)' * log(1 - htheta)); % 成本函数end

如果你现在绘制成本函数，你会看到（除了随机性外）它在大约15次迭代后收敛。

logistic-regression machine-learning matlab statistics

发表回复取消回复