我想在我的测试数据批次上调用tf.keras.Model.evaluate()
(或类似的方法),并希望为每个批次的元素分别获取损失/指标。因此,如果批次长度为64,我希望得到一个包含64个损失/指标的列表。
我需要这样做是为了在测试数据集中找出异常值。
我尝试过在单个批次上调用test_on_batch()
或evaluate()
,但这种方法会聚合批次结果(我认为是通过平均值),而将每个元素单独批处理,虽然可能,但在我GPU上的时间会增加10-20倍。
我还尝试调用predict()
并手动计算损失/指标,但这种方法也会导致性能大幅下降(因为随后需要从测试数据集和预测中手动计算每个损失/指标)。
有没有一种方法可以在不牺牲性能的情况下做到这一点?
回答:
使用TensorFlow的指标/损失函数与model.predict()
结合使用是快速的,并且不涉及循环
考虑这个虚拟的分类任务:
X = np.random.uniform(0,1, (64,28,28,1))y = np.random.randint(0,2, 64)model = Sequential([Flatten(), Dense(2, activation='softmax')])model.compile('adam', loss=tf.keras.losses.SparseCategoricalCrossentropy(), metrics=[tf.keras.metrics.SparseCategoricalAccuracy()])model.fit(X,y, epochs=3)
你可以这样评估每个批次元素的得分:
scce = tf.keras.losses.sparse_categorical_crossentropy(y, model.predict(X))# scce.shape ==> (64,)scca = tf.keras.metrics.sparse_categorical_accuracy(y, model.predict(X))# scca.shape ==> (64,)
这些得分与model.evaluate()
聚合的得分相同
scce_eval, scca_eval = model.evaluate(X,y, verbose=0)
scce_eval
等于tf.reduce_mean(scce)
scca_eval
等于tf.reduce_mean(scca)