我正在尝试在一个回归任务中使用自定义损失函数来计算加权MSE(任务中的值包括:-1、-0.5、0、0.5、1、1.5、3等)。这是我实现的自定义损失函数:
import tensorflowimport tensorflow.keras.backend as kbdef weighted_mse(y, yhat): ind_losses = tensorflow.keras.losses.mean_squared_error(y, yhat) weights_ind = kb.map_fn(lambda yi: weight_dict[kb.get_value(yi)], y, dtype='float32') # 计算批次加权损失的平均值 return tensorflow.math.divide(tensorflow.math.reduce_sum(tensorflow.math.multiply(ind_losses, weights_ind)), len(y))
我运行了一个工作的示例:
weight_dict = {-1.0: 70.78125, 0.0: 1.7224334600760458, 0.5: 4.58502024291498, 1.0: 7.524916943521595, 1.5: 32.357142857142854, 2.0: 50.33333333333333, 2.5: 566.25, 3.0: 566.25}y_true = tensorflow.convert_to_tensor([[0.5],[3]])y_pred = tensorflow.convert_to_tensor([[0.5],[0]])weighted_mse(y_true, y_pred)
但是当我将其输入到我的模型中时,会抛出以下错误:
AttributeError: 'Tensor' object has no attribute '_numpy'
这是我使用自定义损失函数的方式:
model.compile( optimizer=opt, loss={ "predicted_class": weighted_mse })
编辑:
当我将weight_dict[kb.get_value(yi)]
改为weight_dict[float(yi)]
时,我得到了以下错误:
TypeError: float() argument must be a string or a number, not 'builtin_function_or_method'
回答:
你想要的基本上是样本权重的概念。在使用Keras的训练API时,你可以传递另一个包含每个样本权重的数组,这个数组用于确定每个样本在损失函数中的贡献。
要使用它,你可以使用fit
方法的sample_weight
参数:
model.fit(X, y, sample_weight=X_weight, ...)
请注意,X_weight
应该是一个与X
长度相同的数组(即每个训练样本一个权重值)。此外,如果X
是一个tf.data.Dataset
实例或生成器,这个参数不起作用,你需要将样本权重作为X
返回的元组的第三个元素传递。