Y_train = to_categorical(Y_train, num_classes = 10)# random_seed = 2 X_train,X_val,Y_train,Y_val = train_test_split(X_train, Y_train, test_size = 0.1, random_state=random_seed) Y_train.shape model = Sequential() model.add(Flatten()) model.add(Dense(64, activation='relu')) model.add(Dense(128, activation='relu')) model.add(Dense(10, activation='softmax')) model.compile(optimizer = 'adam', loss = 'sparse_categorical_crossentropy',metrics=['accuracy']) model.fit(X_train, Y_train, batch_size = 86, epochs = 3,validation_data = (X_val, Y_val), verbose =2)
我需要将MNIST数据分类成10个类别。我将Y_train转换成了独热编码数组。我查看了许多答案,但都没有帮助。请指导我,因为我在机器学习和神经网络方面还是新手。
回答:
看起来在你的第一层中不需要使用model.add(Flatten())
。你可以改用一个具有特定输入大小的密集层,例如:model.add(Dense(64, input_shape=your_input_shape, activation="relu")
。
为了确保这个问题是由于层引起的,你可以单独在Jupyter Notebook中检查to_categorical()
函数是否正常工作。
更新后的答案
在构建模型之前,你应该重塑你的模型。在这种情况下,将28*28重塑为784。
train_images = train_images.reshape((-1, 784))test_images = test_images.reshape((-1, 784))
我还建议你对数据进行归一化,这可以通过简单地将图像除以255来完成
完成这一步后,你应该创建你的模型。
model = Sequential([Dense(64, activation='relu', input_shape=(784,)),Dense(64, activation='relu'),Dense(10, activation='softmax'),])
你有没有注意到input_shape=(784,)
?这是你平坦化输入的形状。
最后一步,编译和拟合。
model.compile(optimizer='adam',loss='categorical_crossentropy',metrics=['accuracy'],)model.fit(train_images,train_labels,epochs=10,batch_size=16,)
你所做的只是平坦化了输入层,而没有向网络提供输入。这就是你遇到问题的根本原因。关键是你应该手动重塑你的输入,并使用input_shape
参数将它们前向传递到Dense()
层中