我正在使用某种循环神经网络结构进行多标签分类。我的问题与损失函数有关:我的输出将是表示每个标签类别的真/假(1/0)值的向量。许多资源指出汉明损失是合适的目标函数。然而,汉明损失在梯度计算上存在问题:H = average (y_true XOR y_pred),XOR操作无法推导出损失的梯度。那么,是否有其他用于训练多标签分类的损失函数?我已经尝试过使用单独的sigmoid输入的均方误差和二元交叉熵。
回答:
H = average(y_true*(1-y_pred)+(1-y_true)*y_pred)
是汉明损失的连续近似。