Tensorflow: 损失和准确率曲线显示出相似的行为

我使用Tensorflow后端的Keras来训练一个修改后的Resnet-50模型,该模型将对象分类为15个类别。我使用了Adam优化器,并尝试了0.001和0.01的学习率,但得到了相似的结果。

我遇到的问题是,损失和准确率在训练和验证数据集上显示出相似的行为。它们在相同的时间上升或下降,而我原本期望随着损失的下降,准确率会提高。是什么导致了这种行为?

这是我上次运行的一些Tensorboard曲线:训练集准确率和损失

验证集准确率和损失

编辑:模型的代码如下:

#模型创建:
def create_model(possible_labels):
    rn50 = ResNet50(include_top=True, weights=None)
    layer_name = rn50.layers[-2].name
    model = Model(rn50.input, 
             Dense(len(possible_labels))(rn50.get_layer(layer_name).output))
    adam = Adam(lr=0.0001)
    model.compile(loss='categorical_crossentropy', 
             optimizer=adam, metrics=['accuracy'])
    checkpointer = ModelCheckpoint(filepath='the_best_you_ever_had', 
                              verbose=1, save_best_only=True)
    tensorboard = TensorBoard()
    return model, [checkpointer, tensorboard]
model, checkpointers = create_model(labels)
#数据集生成:
train_datagen = ImageDataGenerator(featurewise_center=True,
featurewise_std_normalization=True,
rotation_range=20,
width_shift_range=0.2,
height_shift_range=0.2,
horizontal_flip=True,
vertical_flip=True,
channel_shift_range=0.2,
shear_range=0.2,
zoom_range=0.2)
val_datagen = ImageDataGenerator()
train_generator = train_datagen.flow_from_directory('data\\train',
target_size=(224, 224),
batch_size=32,
class_mode='categorical')
val_generator = val_datagen.flow_from_directory('data\\validation',
target_size=(224, 224),
batch_size=32,
class_mode='categorical')
#模型训练:
model.fit_generator(train_generator,
steps_per_epoch=5000,
epochs=50,
validation_data=val_generator,
callbacks=checkpointers)

回答:

我发现代码中的错误是,我在添加的最后一层使用了默认的(线性)激活函数。我将其改为softmax激活函数(因为这是分类问题而不是回归问题),代码改动如下:

model = Model(rn50.input, 
         Dense(len(possible_labels), activation='softmax') 
        (rn50.get_layer(layer_name).output))

然后,曲线开始按预期表现,我达到了96%的准确率。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注