检查目标时出错:期望dense_18的形状为(1,),但得到的数组形状为(10,)

  Y_train = to_categorical(Y_train, num_classes = 10)#    random_seed = 2    X_train,X_val,Y_train,Y_val = train_test_split(X_train, Y_train, test_size = 0.1, random_state=random_seed)    Y_train.shape    model = Sequential()    model.add(Flatten())    model.add(Dense(64, activation='relu'))    model.add(Dense(128, activation='relu'))    model.add(Dense(10, activation='softmax'))    model.compile(optimizer = 'adam', loss = 'sparse_categorical_crossentropy',metrics=['accuracy'])    model.fit(X_train, Y_train, batch_size = 86, epochs = 3,validation_data = (X_val, Y_val), verbose =2)

我需要将MNIST数据分类成10个类别。我将Y_train转换成了独热编码数组。我查看了许多答案,但都没有帮助。请指导我,因为我在机器学习和神经网络方面还是新手。


回答:

看起来在你的第一层中不需要使用model.add(Flatten())。你可以改用一个具有特定输入大小的密集层,例如:model.add(Dense(64, input_shape=your_input_shape, activation="relu")

为了确保这个问题是由于层引起的,你可以单独在Jupyter Notebook中检查to_categorical()函数是否正常工作。

更新后的答案

在构建模型之前,你应该重塑你的模型。在这种情况下,将28*28重塑为784。

train_images = train_images.reshape((-1, 784))test_images = test_images.reshape((-1, 784))

我还建议你对数据进行归一化,这可以通过简单地将图像除以255来完成

完成这一步后,你应该创建你的模型。

model = Sequential([Dense(64, activation='relu', input_shape=(784,)),Dense(64, activation='relu'),Dense(10, activation='softmax'),])

你有没有注意到input_shape=(784,)?这是你平坦化输入的形状。

最后一步,编译和拟合。

model.compile(optimizer='adam',loss='categorical_crossentropy',metrics=['accuracy'],)model.fit(train_images,train_labels,epochs=10,batch_size=16,)

你所做的只是平坦化了输入层,而没有向网络提供输入。这就是你遇到问题的根本原因。关键是你应该手动重塑你的输入,并使用input_shape参数将它们前向传递到Dense()层中

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注