我使用resnet50解决了一个多类分类问题。模型输出了每个类别的概率。我应该为我的模型选择哪个损失函数?
上述结果是使用相同模型但不同损失函数的结果。这个模型应该将图像分类为26个类别,所以分类交叉熵应该有效。另外,在第一种情况下准确率约为96%,但损失值却很高。这是为什么?
回答:
对于多类分类问题,您绝对需要使用 categorical_crossentropy
。binary_crossentropy
会将您的问题简化为二元分类问题,这在没有进一步研究的情况下是不清楚的。
我认为您在第一种(以及某种程度上在第二种)情况下看到高准确率的原因是过拟合。您添加的第一个全连接层包含800万个参数(!!!要查看这一点,可以执行 model.summary()
),而您只有7万张图像来训练它,并且只使用了8个epoch。这种架构选择在计算能力和数据需求上都非常苛刻。您还在使用一个非常基础的优化器(SGD
)。尝试使用更强大的 Adam
。
最后,我对您在输出层选择 'sigmoid'
激活函数感到有点惊讶。为什么不选择更经典的 'softmax'
?