我计划创建一个CNN来预测蘑菇类型,并从互联网上收集了超过2500张照片。数据集有156个类别(不同类型的蘑菇)。我使用TensorFlow 2和Keras的ImageDataGenerator进行了训练。以下是图像生成器:
image_gen = ImageDataGenerator(rotation_range = 20, width_shift_range=0.12, height_shift_range=0.12, shear_range=0.1, zoom_range = 0.06, horizontal_flip=True, fill_mode='nearest', rescale=1./255)
以下是模型:
model = Sequential()model.add(Conv2D(filters=32,kernel_size=(3,3),input_shape=image_shape,activation='relu'))model.add(MaxPool2D(pool_size=(2,2)))model.add(Conv2D(filters=64,kernel_size=(3,3),input_shape=image_shape,activation='relu'))model.add(MaxPool2D(pool_size=(2,2)))model.add(Conv2D(filters=64,kernel_size=(3,3),input_shape=image_shape,activation='relu'))model.add(MaxPool2D(pool_size=(2,2)))model.add(Flatten())model.add(Dense(2,activation='relu'))model.add(Dropout(0.5))model.add(Dense(156,activation='softmax'))model.compile(loss = 'categorical_crossentropy',optimizer='adam',metrics=['accuracy'])
使用早期停止如下:
early_stop = EarlyStopping(monitor='val_loss',patience=2)
模型从acc=0.006开始,经过20个epoch后停止,精度约为0.2。
当我预测测试集中的一张图片时,我得到了这样的荒谬结果(我在数组中看到一个’1.’,但测试图像应该对应数组的最后一个元素):编译模型后的随机图像预测
如果不使用早期停止(我认为这是过拟合?),2000个epoch完成后,精度达到了0.8,但预测结果仍然是错误的。
第一个问题低精度的原因是什么?是因为我的数据样本太少了吗?我读到过Class_num/100,所以156/100在我的情况下可能是好的精度,但当我预测测试文件中的一张照片时,它永远找不到对应的蘑菇类型。
我尝试过使用一个更大的数据集,包含7000多张照片,只有9个类别,结果精度达到了0.23。但在测试案例中,
model.predict(my_image_arr).round(3)
无论我输入什么照片,结果如下:
array([[0.063, 0.11 , 0.153, 0.123, 0.064, 0.059, 0.208, 0.162, 0.059]], dtype=float32)
如果有人能帮助我指出我做错的地方,我将非常感激。
回答: