在Tensorflow中，sampled_softmax_loss和softmax_cross_entropy_with_logits有什么区别？

我阅读了Tensorflow的文档，并在谷歌上搜索了更多信息，但没有找到它们的区别。在我看来，这两种方法似乎都是使用softmax函数来计算损失的。

loss = tf.reduce_mean(tf.nn.sampled_softmax_loss(...))

loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(P, Q))

对我来说，计算softmax损失与计算softmax后的交叉熵是相同的（例如，cross_entropy(softmax(train_x))）。

能否有人告诉我为什么有两种不同的方法，以及在什么情况下应该使用哪种方法？

回答：

如果你的目标词汇量（换句话说，你想要预测的类别数量）非常大，使用常规的softmax会非常困难，因为你必须为字典中的每个词计算概率。通过使用sampled_softmax_loss，你只需要考虑词汇的一个子集V来计算损失。

采样softmax只有在我们采样的V小于词汇量时才有意义。如果你的词汇量（标签数量）较小，就没有必要使用sampled_softmax_loss。

你可以在这篇论文中看到实现细节。

你还可以查看使用它的示例 – 序列到序列翻译，在这个示例中。

学技术