选择损失函数需要帮助

我使用resnet50解决了一个多类分类问题。模型输出了每个类别的概率。我应该为我的模型选择哪个损失函数?

选择二元交叉熵后的结果:enter image description here

选择分类交叉熵后的结果:enter image description here

上述结果是使用相同模型但不同损失函数的结果。这个模型应该将图像分类为26个类别,所以分类交叉熵应该有效。另外,在第一种情况下准确率约为96%,但损失值却很高。这是为什么?

编辑2:模型架构:enter image description here

enter image description here

enter image description here

enter image description here


回答:

对于多类分类问题,您绝对需要使用 categorical_crossentropybinary_crossentropy 会将您的问题简化为二元分类问题,这在没有进一步研究的情况下是不清楚的。

我认为您在第一种(以及某种程度上在第二种)情况下看到高准确率的原因是过拟合。您添加的第一个全连接层包含800万个参数(!!!要查看这一点,可以执行 model.summary()),而您只有7万张图像来训练它,并且只使用了8个epoch。这种架构选择在计算能力和数据需求上都非常苛刻。您还在使用一个非常基础的优化器(SGD)。尝试使用更强大的 Adam

最后,我对您在输出层选择 'sigmoid' 激活函数感到有点惊讶。为什么不选择更经典的 'softmax'

Related Posts

多维度Top-k评分

例如,在机器学习中的自然语言处理中,通常使用波束搜索来…

R – Caret train() “错误:停止” 与 “在newdata中未找到对象中使用的所有变量名”

我正在尝试为蘑菇数据构建一个简单的朴素贝叶斯分类器。我…

创建训练和测试数据集分割,数据嵌套在多个文件夹中

我正在准备数据以训练一个图像识别模型。目前我有一个文件…

我的神经网络预测出现错误:IndexError: list index out of range

我正在进行一个简单的垃圾邮件/非垃圾邮件文本分类。我的…

python 给出数组是一维的,但索引了两个维度错误

我已经为 miniBatchGradientDesce…

TensorFlow自定义训练步骤使用不同的损失函数

背景 根据TensorFlow文档,可以使用以下方式执…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注