我正在计算一个数据集的成本。有没有办法简化这个嵌套的for循环?我应该使用apply函数还是矩阵乘法?
更多背景:这是用于机器学习的多类别逻辑损失。y_m是一个从标签y(10个标签的分类)派生的指示矩阵。我通过随机生成h2和y来简化问题,以获得一个最小的可重现代码。
h2=matrix(runif(5000*10),ncol=10)y=round(runif(5000)*9)+1y_m <- matrix(0,ncol=10,nrow=length(y))y_m[cbind(1:length(y),y)] <- 1J=0for(i in 1:5000){ for(k in 1:10){ J=J-y_m[i,k]*log(h2[i,k])-(1-y_m[i,k])*log(1-h2[i,k]); }}J
回答:
试试这个:
J <- sum( - y_m * log(h2) - (1-y_m) * log(1-h2) )