我正在尝试使用LSTM训练一个简单的多对一RNN分类器。我的时间步长为100个数据点,每个数据点有7个特征,总共有192382个样本。以下是我的模型:
model = Sequential()model.add(LSTM(50,input_shape = (100,7),name = 'LSTM',return_sequences=False))model.add(Dropout(0.2))model.add(Dense(3, activation='softmax',name = 'softmax_layer'))model.compile(optimizer='adam',loss='categorical_crossentropy',metrics=['accuracy'],name='softmax')model.fit(datax,datay,epochs=25,batch_size=128)model.summary()
模型编译时没有错误,但无法进行训练。以下是返回的错误信息:
ValueError: Error when checking target: expected softmax_layer to have shape (None, 3) but got array with shape (192282, 100)
为什么softmax层返回一个(192282, 100)的矩阵?LSTM层中的return_sequence=False不是应该每个时间步只给我一个输出吗?
回答:
实际上,softmax_layer返回的是(None, 3),因为最后一层的尺寸是3。
你可能需要修复这个问题。为了修复它,你需要确保输出层(softmax_layer)的尺寸与你的标签数组(datay.shape[1])的尺寸相等。换句话说,它必须等于类别的数量。
快速修复方法是:
model = Sequential()model.add(LSTM(50,input_shape = (100,7),name = 'LSTM',return_sequences=False))model.add(Dropout(0.2))model.add(Dense(datay.shape[1], activation='softmax',name = 'softmax_layer'))model.compile(optimizer='adam',loss='categorical_crossentropy',metrics=['accuracy'],name='softmax')model.fit(datax,datay,epochs=25,batch_size=128)model.summary()