我在对VGG19模型进行微调以适应MNIST任务。MNIST数据集中的图像尺寸为(28,28,1),即单通道图像。然而,VGG模型需要输入的尺寸为(?,?,3),即三通道图像。
因此,我的解决方法是在所有VGG层之前添加一个Conv2D层,将(28,28,1)的数据转换为(28,28,3),以下是我的代码:
inputs = Input(shape=(28,28,1))x = Conv2D(3,kernel_size=(1,1),activation='relu')(inputs)print(x.shape)# out: (?, 28, 28, 3)
现在我的输入形状应该是正确的(我认为)。
以下是我的完整模型: # 更改输入形状: inputs = Input(shape=(28,28,1)) x = Conv2D(3,kernel_size=(1,1),activation=’relu’)(inputs)
# 添加池化层和全连接层:x = base_model(x)x = GlobalMaxPooling2D()(x)x = Dense(1024,activation='relu')(x)predictions = Dense(10,activation='softmax')(x)model = Model(inputs=inputs, outputs=predictions)# 冻结基础模型的层:for layer in base_model.layers: layer.trainable = Falsemodel.compile(optimizer='adam',loss='categorical_crossentropy',metric=['accuracy'])
然后我得到了以下错误:
InvalidArgumentError: Negative dimension size caused by subtracting 2 from 1 for 'vgg19_10/block5_pool/MaxPool' (op: 'MaxPool') with input shapes: [?,1,1,512].
我已经搜索过这个问题,一个解决方案是添加
from keras import backend as KK.set_image_dim_ordering('th')
但这对我不起作用。
我的代码有什么问题吗?
回答:
在进行分类任务时,我们应该在输出层使用softmax激活函数。
请将最后一层的激活函数更改为softmax
从
predictions = Dense(10,activation='relu')(x)
改为
predictions = Dense(10,activation='softmax')(x)
导致错误的第二个问题是关于你的输入尺寸。根据keras vgg19文档,你的最小图像尺寸不应小于48。
inputs = Input(shape=(48,48,1))