我第一次使用Keras构建卷积神经网络。我的层结构如下:
layers = [Conv2D(8,kernel_size=(4,4),padding='same',input_shape=( 200, 180,3),kernel_initializer="glorot_normal",data_format="channels_first"),Activation("relu"),MaxPooling2D(pool_size=(8,8),padding='same',data_format='channels_first'),Conv2D(16,(2,2),padding='same',kernel_initializer="glorot_normal"),Activation("relu"),MaxPooling2D(pool_size=(4,4),padding='same',data_format='channels_first'),Conv2D(4,(3,3),padding='same',kernel_initializer="glorot_normal"),Activation("relu"),MaxPooling2D(pool_size=(2,2),padding='same',data_format='channels_first'),Flatten(),Dense(2,input_shape=(48,)),Softmax(axis=-1)]#Edit, here is the part for compiling the model and fitting itmodel = Sequential(layers) model.compile(optimizer="adam",loss="sparse_categorical_crossentropy" metrics=["accuracy"])trainHistory = model.fit(x=X_train,y=Y_train,batch_size=3,epochs=1000)
我的标签数组形状为(,2)
。但是当我尝试在模型上使用fit
时,它提示softmax_1
预期形状为(1,)
。但我已经明确指出Dense
层的单元数为2,并且softmax会返回与输入相同维度的输出。
那么这个1是从哪里来的?我尝试使用一维的虚拟标签数组,结果可以运行。那么我哪里做错了?我如何使用我现有的二维数组?
回答:
问题在于您使用了sparse_categorical_crossentropy
作为损失函数。这种损失函数在给定的标签(即Y_train
)被编码为整数(即0, 1, 2, …)时使用。然而,如果标签是独热编码的,像您的代码中那样,您需要改用categorical_crossentropy
作为损失函数。