我正在调整我的CNN架构,以提高在CIFAR-10数据集上的性能。
虽然设置大多数超参数相对简单,但选择每层的滤波器数量似乎有些模糊不清。
最初设置滤波器数量以及后续层中滤波器数量的正确框架或直觉是什么?
回答:
没有直接的方法知道应该为您的模型使用多少滤波器。不过,您可以测试一些值,如16、32、64、128、256…
有一个自动化这个过程的想法,我用它来寻找神经网络中合适的卷积层和滤波器数量。
conv_layers = [3, 4, 5]units = [32,64,128]for conv_layer in conv_layers: for unit in units: Name = "CNN-LSTM-{}convl--{}LSTM-{}-time".format(conv_layer,unit,int(time.time())) model = Sequential() model.add(Input(shape=(IMG_HEIGHT, IMG_WIDTH, 3))) model.add(Reshape(target_shape=(IMG_HEIGHT, IMG_WIDTH * 3))) model.add(Conv1D(filters=64, kernel_size=3, padding="same", activation='relu', input_shape=(IMG_HEIGHT, IMG_WIDTH * 3), data_format='channels_last')) for i in range(conv_layer-1): model.add(Conv1D(filters=64, kernel_size=3, padding="same", activation='relu')) model.add(MaxPooling1D(pool_size=3)) model.add(Conv1D(filters=128, kernel_size=3, padding="same", activation='relu')) model.add(Conv1D(filters=128, kernel_size=3, padding="same", activation='relu')) model.add(LSTM(unit, activation='relu')) model.add(BatchNormalization()) model.add(Flatten()) model.add(Dense(4, activation='softmax')) model.build(input_shape=(batch_size, IMG_HEIGHT, IMG_WIDTH, 3)) model.summary()
训练后,您可以使用Tensorboard来可视化您的结果,并选择最适合您数据的架构。
这可能会花费更多的训练时间,所以在训练过程中要考虑保存模型。
希望这对您有帮助。