为什么使用Keras和Python进行图像分类任务的CNN模型训练会出现错误

我刚开始学习图像处理,并使用Keras和TensorFlow进行多图像分类。我正在使用的代码如下:

   import tensorflow as tf   from tensorflow.keras import datasets, layers, models   import pandas as pd   import numpy as np

数据集已经分为训练集和测试集。训练集和测试集是图像数组,标签是从CSV文件中提取的。

   X_train = np.load('X_train_images.npy')   X_test =  np.load('X_test_images.npy')   Y_train = pd.read_csv('Y_train_Labels.csv',encoding='latin-1')   Y_test =  pd.read_csv('Y_test_Labels.csv',encoding='latin-1')    Y_train = Y_train['label'].to_numpy()   Y_test = Y_test['label'].to_numpy()      print(X_train.shape)   print(X_test.shape)   print(Y_train.shape)   print(Y_test.shape)

所以数据集的形状是:

  (4000, 4, 4, 512)  (1000, 4, 4, 512)  (4000,)  (1000,)

所以定义模型如下:

  batch_size=32  epochs=10  model=tf.keras.Sequential()   model.add(tf.keras.layers.Conv2D(32,kernel_size=(3,3),activation='relu',input_shape=(4,4,512)))  model.add(tf.keras.layers.MaxPooling2D(pool_size=(2,2)))   #我添加了两个Dropout层以防止过拟合   model.add(tf.keras.layers.Dropout(0.25))   model.add(tf.keras.layers.Flatten())   model.add(tf.keras.layers.Dense(1024,activation='relu'))   model.add(tf.keras.layers.Dropout(0.5))   model.add(tf.keras.layers.Dense(10,activation='softmax'))  

编译模型并进行训练:

   model.compile(loss='categorical_crossentropy',                       optimizer=tf.keras.optimizers.Adam(lr=0.001,decay=1e-6), metrics=['accuracy'])    model.fit(X_train/255.0, tf.keras.utils.to_categorical(Y_train),              batch_size=batch_size, shuffle=False, epochs=epochs,              validation_data=(X_test/255.0, tf.keras.utils.to_categorical(Y_test))             )

最后的预测得分:

   predictions=model.predict(x_test)    scores = model.evaluate(x_test / 255.0, tf.keras.utils.to_categorical(y_test)                          )

在训练模型时,我在以下代码行遇到了输入形状错误:

    validation_data=(X_test/255.0, tf.keras.utils.to_categorical(Y_test)) 

错误信息是:

    ValueError: Shapes (32, 9) and (32, 10) are incompatible

我不明白为什么会出现这个错误,因为我知道这是由于类别的形状引起的?

谢谢


回答:

这是数据和模型输入形状不匹配:您的输入是 input_shape=(512,4,4),而训练数据的形状是 batch, 4, 4, 512。如果模型的输入计划为这种形状,请使用 numpy.transpose() 更改您的数据以匹配模型的输入。否则,请更改您的模型输入。

输出也有相同的问题,但原因不同:模型生成的输出是密集列表,而训练数据是以类别编号编码的。解决方案是将输入数据转换为分类数据:

from tf.keras.utils import to_categorical# 定义示例数据data = [1, 3, 2, 0, 3, 2, 2, 1, 0, 1]data = array(data)print(data)# 独热编码encoded = to_categorical(data)

查看详细信息教程

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注