softmax和log-softmax有什么区别?

这两个函数的区别在pytorch的帖子中已经描述过:log_softmax和softmax有什么区别?,softmax的公式为:exp(x_i) / exp(x).sum(),而log softmax的公式为:log(exp(x_i) / exp(x).sum())

但对于下面的Pytorch代码,为什么我得到的输出不同:

>>> it = autograd.Variable(torch.FloatTensor([0.6229,0.3771]))>>> op = autograd.Variable(torch.LongTensor([0]))>>> m  = nn.Softmax()>>> log = nn.LogSoftmax()>>> m(it)Variable containing:`0.5611  0.4389`[torch.FloatTensor of size 1x2]>>>log(it)Variable containing:-0.5778 -0.8236[torch.FloatTensor of size 1x2]

然而,log(0.5611)的值是-0.25095973129,log(0.4389)的值是-0.35763441915

为什么会有这样的差异?


回答:

默认情况下,torch.log提供的是输入的自然对数,因此PyTorch的输出是正确的:

ln([0.5611,0.4389])=[-0.5778,-0.8236]

您的最后结果是使用以10为底的对数得到的。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注