Caffe sigmoid交叉熵损失

我在多标签分类问题中使用了sigmoid交叉熵损失函数,参考了这个教程。然而,无论是在教程中的结果还是我的结果中,输出预测都在(-Inf, Inf)范围内,而sigmoid函数的范围应该是[0, 1]。sigmoid函数只在反向传播中处理吗?也就是说,前向传递不应该压缩输出吗?


回答:

在这个例子中,输入到"SigmoidCrossEntropyLoss"层的,是一个全连接层的输出。确实,"InnerProduct"层的输出值没有限制,可以在[-inf, inf]范围内。
然而,如果你仔细检查"SigmoidCrossEntropyLoss",你会注意到它内部包含了一个"Sigmoid"——以确保梯度估计的稳定性。
因此,在测试时,你应该用一个简单的"Sigmoid"层替换"SigmoidCrossEntropyLoss",以输出每个类别的预测结果。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注