我在Keras中运行一个全卷积网络(FCN),它使用二元交叉熵作为损失函数。然而,我不确定损失是如何累积的。
我知道损失是在像素级别应用的,但每个像素的损失是如何累积的呢?是将图像中每个像素的损失相加形成单一的图像损失,还是这些损失被平均化了?
此外,每个图像的损失在批次中是简单地相加(还是进行其他操作)?
回答:
我假设你的问题是一般的,而不是针对特定模型的(如果不是这样,你能分享你的模型吗?)。
你是对的,如果在像素级别使用交叉熵,结果必须在所有像素上进行归约(相加或平均)以获得单一值。
这是一个在TensorFlow中卷积自编码器的例子,其中这一步骤是具体的:
相关代码行是:
loss = tf.nn.sigmoid_cross_entropy_with_logits(labels=targets_, logits=logits)cost = tf.reduce_mean(loss)
无论你是取成本函数的平均值还是总和,都不会改变最小化器的值。但是,如果你取平均值,那么当你改变批次大小或图像大小的时候,成本函数的值更容易在不同实验之间进行比较。