我正在尝试构建一个CNN自编码器。每个训练图像(彩色)的尺寸为200*200。在编译时我遇到了以下错误:ValueError: Error when checking target: expected activation_7 to have shape (154, 154, 1) but got array with shape (200, 200, 3)
,使用了下面的代码。如何修改代码以使其工作?
autoencoder = Sequential()autoencoder.add(Conv2D(64, (3, 3), input_shape=(200, 200, 3)))autoencoder.add(Activation('relu'))autoencoder.add(MaxPooling2D(pool_size=(2, 2)))autoencoder.add(Conv2D(32, (3, 3)))autoencoder.add(Activation('relu'))autoencoder.add(MaxPooling2D(pool_size=(2, 2)))autoencoder.add(Conv2D(32, (3, 3)))autoencoder.add(Activation('relu'))autoencoder.add(MaxPooling2D(pool_size=(2, 2))) # encodedautoencoder.add(Conv2D(32, (3, 3)))autoencoder.add(Activation('relu'))autoencoder.add(UpSampling2D((2,2)))autoencoder.add(Conv2D(32, (3, 3)))autoencoder.add(Activation('relu'))autoencoder.add(UpSampling2D((2,2)))autoencoder.add(Conv2D(64, (3, 3)))autoencoder.add(Activation('relu'))autoencoder.add(UpSampling2D((2,2)))autoencoder.add(Conv2D(1, (3, 3)))autoencoder.add(Activation('sigmoid'))autoencoder.compile(optimizer='adadelta', loss='binary_crossentropy')
回答:
在我看来,您的代码有两个主要问题。
第一个问题是尺寸减少,从(200,200)变为(154,154),这个问题可以通过在每个Conv2D层中添加padding=’same’来轻松解决,如下所示:
autoencoder = Sequential()autoencoder.add(Conv2D(64, (3, 3), input_shape=(200, 200, 3), padding='same'))autoencoder.add(Activation('relu'))autoencoder.add(MaxPooling2D(pool_size=(2, 2)))autoencoder.add(Conv2D(32, (3, 3), padding='same'))autoencoder.add(Activation('relu'))autoencoder.add(MaxPooling2D(pool_size=(2, 2)))autoencoder.add(Conv2D(32, (3, 3), padding='same'))autoencoder.add(Activation('relu'))autoencoder.add(MaxPooling2D(pool_size=(2, 2))) # encodedautoencoder.add(Conv2D(32, (3, 3), padding='same'))autoencoder.add(Activation('relu'))autoencoder.add(UpSampling2D((2,2)))autoencoder.add(Conv2D(32, (3, 3), padding='same'))autoencoder.add(Activation('relu'))autoencoder.add(UpSampling2D((2,2)))autoencoder.add(Conv2D(64, (3, 3), padding='same'))autoencoder.add(Activation('relu'))autoencoder.add(UpSampling2D((2,2)))autoencoder.add(Conv2D(1, (3, 3), padding='same'))autoencoder.add(Activation('sigmoid'))autoencoder.compile(optimizer='adadelta', loss='binary_crossentropy')
第二个问题与您的目标有关。您试图在最后的Conv2D
层预测输出(200,200,1)
,使用sigmoid激活函数
和二元交叉熵损失
,这意味着您想要预测的是灰度图像。如果这是您想要的,那么您需要用单通道图像(200,200,1)来训练您的模型,否则您可以将输出更改为(200,200,3),如下所示:
将:
autoencoder.add(Conv2D(1, (3, 3), padding='same'))
更改为:
autoencoder.add(Conv2D(3, (3, 3), padding='same'))