我正在尝试使用精确匹配/子集准确率作为我Keras模型的评估指标。我基本理解它应该如何工作,但在张量操作上遇到了困难。
我正在进行一个多标签分类任务,共有55个可能的标签。我认为输出大于0.5的视为该标签的正样本。我希望有一个指标来描述输出与真实标签完全匹配的频率。
我的方法是将y_true
转换为tf.bool
,将y_pred > 0.5
转换为tf.bool
,然后返回一个张量,如果它们完全匹配则包含True
,否则包含False
。当我进行基本测试时,它似乎是工作的,但当我训练模型时,它一直保持在0.0000
,从未改变过。
def subset_accuracy(y_true, y_pred): y_pred_bin = tf.cast(y_pred > 0.5, tf.bool) equality = tf.equal(tf.cast(y_true, tf.bool), y_pred_bin) return tf.equal( tf.cast(tf.math.count_nonzero(equality), tf.int32), tf.size(y_true) )
我期望看到这个指标逐渐上升,即使它只能达到50%左右。但它一直保持在0.0。
回答:
这里是另一个选项,已在tensorflow 2.3中测试过:
def subset_accuracy(y_true, y_pred): threshold = tf.constant(.8, tf.float32) gtt_pred = tf.math.greater(y_pred, threshold) gtt_true = tf.math.greater(y_true, threshold) accuracy = tf.reduce_mean(tf.cast(tf.equal(gtt_pred, gtt_true), tf.float32), axis=-1) return accuracy
我认为tf.cast(y_true, tf.bool)
可能会有问题,因为它将浮点数转换为布尔值,所以取决于tf内部如何处理它,可能会先转换为整数,因此任何小于1.0的值都会变为零,然后再转换为布尔值。这就是为什么没有任何匹配,你只会得到零准确率。
上面的建议避免了这个问题。