我正在为一个多类别问题开发一个图像分类模型。我已经成功启动并运行了模型,但当我尝试预测/测试模型时,它似乎只能识别四种图像类型中的一种(无论我如何更改模型,识别结果始终是同一类)。每个类别的数据集都很小,但我确实使用了图像生成器来增加数据量。模型应该能够识别带有一些噪点的图像。
我的挑战可以归结为以下几点:
- 数据量小。每个类别少于100张图片。
- 我的模型不是为了识别特定的图形,而是要识别图片中的整体模式(如特定颜色的区域等)。
- 许多图片包含大量的白色和文字。我是否需要进行任何图像预处理来帮助模型?
我的模型结构如下:
model = Sequential()model.add(Conv2D(32, (3, 3), padding='same', activation='relu', input_shape=(s1,s2,3), data_format = "channels_first"))model.add(MaxPooling2D(pool_size=(2, 2)))model.add(Dropout(0.25))model.add(Conv2D(64, (3, 3), padding='same', activation='relu'))model.add(MaxPooling2D(pool_size=(2, 2)))model.add(Dropout(0.25))model.add(Conv2D(64, (3, 3), activation='relu'))model.add(MaxPooling2D(pool_size=(2, 2)))model.add(Dropout(0.25))model.add(Flatten())model.add(Dense(50, activation='relu'))model.add(Dropout(0.5))model.add(Dense(4, activation='softmax'))model.compile(loss='categorical_crossentropy', optimizer='Adam', metrics=['accuracy'])
图像大小为250×250,批处理大小为16。
检查准确率和损失曲线
大家有什么建议吗?
提前谢谢!
回答:
这是典型的过拟合。你需要严重限制你的模型和/或使用迁移学习来对抗这种行为。对于限制选项,你可以增加dropout并添加L2正则化。根据我的经验,L2正则化真的会使神经网络的问题变得困难。至于迁移学习,你可以使用ResNet并只训练最后的2-3层。
然而,没有什么能比得上拥有更多的数据点。