在Keras中实现动态类权重是否可行?

Keras支持class_weights功能,允许为不同类别分配不同的权重 – 例如在样本数量不平衡时

我想做类似的事情,但使用基于每批次类别不平衡的动态权重。

这是可能的吗?


回答:

选项1:

手动循环处理epochs和batches,使用train_on_batch方法,该方法也接受class_weight参数:

for epoch in range(epochs):    for batchX,batchY in batches: #根据你创建/获取批次的方式调整这个循环        weights = calculateOrGetTheWeights(batch)        model.train_on_batch(batchX,batchY,...,class_weight=weights)

选项2:

创建自定义损失函数。这可能更复杂,取决于数据格式、类别数量、损失函数类型等。

假设是2D数据(样本,类别)并且是多类别问题:

import keras.backend as Kdef customLoss(yTrue,yPred):    classes = K.argmax(yTrue)    classCount = K.sum(yTrue,axis=0)    loss = K.some_loss_function(yTrue,yPred)    return loss / K.gather(classCount, classes)

假设是二分类问题(只有1个类别)且数据是1D或2D的:

import keras.backend as Kdef binaryCustomLoss(yTrue,yPred):    positives = yTrue    negatives = 1 - yTrue    positiveRatio = K.mean(positives)    negativeRatio = 1 - positiveRatio #或者K.mean(negatives)    weights = (positives / positiveRatio) + (negatives / negativeRatio)    #你可能需要在这里使用K.squeeze(weights)    return weights * K.some_loss_function(yTrue,yPred)

警告:如果任何类别的计数为零,这两个损失函数都会返回Nan(或无穷大)。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注