我尝试将 p = 1/1+e^(-z) 代回第一个函数,但无法得到简化的函数。
对于中间项,我得到的是 z(1-t^i) 的和,而不是 t^i z^i 的和。我不知道哪里出了问题。
回答:
由于您没有发布您的解决方案,我无法指出您犯了什么错误,但我认为您需要同时代入 p(C=0|x,w) 和 p(C=1|x,w),而不仅仅是 p=1/1+e^(-z)。以下是推导过程 –
在主方程(第一个方程)中代入 p(C=0|x,w) 和 p(C=1|x,w)(sum==求和),z 表示 z^(i)
L=-sum(t^(i)*log(e^-z))+sum(t^(i)*log(1+e^-z))+sum(log(1+e^-z)-sum(t^(i)*log(1+e^-z))
第二项和第四项会抵消。我们得到
L=-sum(t^(i)*log(e^-z))+sum(log(1+e^-z)
根据对数的性质,log(e^(-z))=z。因此
L=sum(log(1+e^-z)+sum(t^(i)*z)