我的二分类模型的准确率似乎停滞不前:我哪里做错了?

我尝试使用医学图片数据集(具体来说是LIDC数据集)训练了一个二分类模型,我认为这与“狗与猫”分类问题相差不大(区分良性和恶性结节)。

问题是,准确率似乎从一开始就停滞在65%左右,并且没有任何变化。我是不是做错了什么?我朋友提供的示例轻松达到了80%以上,并且准确率在每个epoch后都有所提高,但我的却没有 :/

我是在已经提取的、尺寸相同且分成两类的图像块上进行训练的。

我使用的是为此任务微调的VGG16模型(我替换了全连接层为新的层,冻结了之前的层并尝试训练)。

我尝试过更改为binary_crossentropy,使用to_categorical,将最后一层的输出节点从1改为2。此时,我对适合我问题的正确参数组合感到困惑。对不起,如果我听起来像一个绝对的初学者…

我尝试跳过了代码中不太重要的部分,希望它是可读的

training_data_dir = "flow/training" validation_data_dir = "flow/validation" test_data_dir = "flow/test" from keras.preprocessing.image import ImageDataGeneratortraining_data_generator = ImageDataGenerator(rescale=1./255)validation_data_generator = ImageDataGenerator(rescale=1./255)test_data_generator = ImageDataGenerator(rescale=1./255)training_generator = training_data_generator.flow_from_directory(    training_data_dir,    target_size=(IMAGE_WIDTH, IMAGE_HEIGHT),    batch_size=BATCH_SIZE,    class_mode="binary")validation_generator = validation_data_generator.flow_from_directory(    validation_data_dir,    target_size=(IMAGE_WIDTH, IMAGE_HEIGHT),    batch_size=BATCH_SIZE,    class_mode="binary")test_generator = test_data_generator.flow_from_directory(    test_data_dir,    target_size=(IMAGE_WIDTH, IMAGE_HEIGHT),    batch_size=1,    class_mode="binary",     shuffle=False)vgg16_model = VGG16(weights="imagenet", include_top=False,input_tensor=Input(shape=(57, 57, 3)))vgg16_model.summary()model = Sequential()for layer in vgg16_model.layers:layer.trainable = False  model.add(layer)model.add(Flatten())model.add(Dense(4096, activation='relu'))model.add(Dense(1024, activation='relu'))model.add(Dense(1, activation='softmax'))model.compile(loss='binary_crossentropy',              optimizer=keras.optimizers.Adam(lr=1e-5),              metrics=['accuracy'])model.fit_generator(training_generator,    steps_per_epoch=len(training_generator.filenames) // BATCH_SIZE,    epochs=EPOCHS,    validation_data=validation_generator,    validation_steps=len(validation_generator.filenames) // BATCH_SIZE,     verbose=2)

回答:

由于你有一个单元输出的层和二元交叉熵损失,你应该为最后一层使用sigmoid激活函数;将其更改为:

model.add(Dense(1, activation='sigmoid'))

另外,建议至少在开始时将Adam的学习率保持默认,即:

optimizer=keras.optimizers.Adam()

在你的model.compile中。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注