我刚开始学习图像处理,并使用Keras和TensorFlow进行多图像分类。我正在使用的代码如下:
import tensorflow as tf from tensorflow.keras import datasets, layers, models import pandas as pd import numpy as np
数据集已经分为训练集和测试集。训练集和测试集是图像数组,标签是从CSV文件中提取的。
X_train = np.load('X_train_images.npy') X_test = np.load('X_test_images.npy') Y_train = pd.read_csv('Y_train_Labels.csv',encoding='latin-1') Y_test = pd.read_csv('Y_test_Labels.csv',encoding='latin-1') Y_train = Y_train['label'].to_numpy() Y_test = Y_test['label'].to_numpy() print(X_train.shape) print(X_test.shape) print(Y_train.shape) print(Y_test.shape)
所以数据集的形状是:
(4000, 4, 4, 512) (1000, 4, 4, 512) (4000,) (1000,)
所以定义模型如下:
batch_size=32 epochs=10 model=tf.keras.Sequential() model.add(tf.keras.layers.Conv2D(32,kernel_size=(3,3),activation='relu',input_shape=(4,4,512))) model.add(tf.keras.layers.MaxPooling2D(pool_size=(2,2))) #我添加了两个Dropout层以防止过拟合 model.add(tf.keras.layers.Dropout(0.25)) model.add(tf.keras.layers.Flatten()) model.add(tf.keras.layers.Dense(1024,activation='relu')) model.add(tf.keras.layers.Dropout(0.5)) model.add(tf.keras.layers.Dense(10,activation='softmax'))
编译模型并进行训练:
model.compile(loss='categorical_crossentropy', optimizer=tf.keras.optimizers.Adam(lr=0.001,decay=1e-6), metrics=['accuracy']) model.fit(X_train/255.0, tf.keras.utils.to_categorical(Y_train), batch_size=batch_size, shuffle=False, epochs=epochs, validation_data=(X_test/255.0, tf.keras.utils.to_categorical(Y_test)) )
最后的预测得分:
predictions=model.predict(x_test) scores = model.evaluate(x_test / 255.0, tf.keras.utils.to_categorical(y_test) )
在训练模型时,我在以下代码行遇到了输入形状错误:
validation_data=(X_test/255.0, tf.keras.utils.to_categorical(Y_test))
错误信息是:
ValueError: Shapes (32, 9) and (32, 10) are incompatible
我不明白为什么会出现这个错误,因为我知道这是由于类别的形状引起的?
谢谢
回答:
这是数据和模型输入形状不匹配:您的输入是 input_shape=(512,4,4)
,而训练数据的形状是 batch, 4, 4, 512
。如果模型的输入计划为这种形状,请使用 numpy.transpose()
更改您的数据以匹配模型的输入。否则,请更改您的模型输入。
输出也有相同的问题,但原因不同:模型生成的输出是密集列表,而训练数据是以类别编号编码的。解决方案是将输入数据转换为分类数据:
from tf.keras.utils import to_categorical# 定义示例数据data = [1, 3, 2, 0, 3, 2, 2, 1, 0, 1]data = array(data)print(data)# 独热编码encoded = to_categorical(data)