我在设置LSTM网络的维度时遇到了困难。
我的数据如下:
train_data.shape (25391, 3) # 应理解为25391个时间步和3个特征
train_labels.shape (25391, 1) # 应理解为25391个时间步和1个特征
我认为我的输入维度应该是(1, len(train_data), train_data.shape[1])
,因为我计划提交一个批次。但我得到了以下错误:
Error when checking target: expected lstm_10 to have 2 dimensions, but got array with shape (1, 25391, 1)
这是模型代码:
model = Sequential()
model.add(LSTM(1, # 预测一个特征和一个时间步
batch_input_shape=(1, len(train_data), train_data.shape[1]),
activation='tanh',
return_sequences=False))
model.compile(loss = 'categorical_crossentropy', optimizer='adam', metrics = ['accuracy'])
print(model.summary())
# 作为1个样本,包含len(train_data)个时间步和train_data.shape[1]个特征。
model.fit(x=train_data.values.reshape(1, len(train_data), train_data.shape[1]),
y=train_labels.values.reshape(1, len(train_labels), train_labels.shape[1]),
epochs=1,
verbose=1,
validation_split=0.8,
validation_data=None,
shuffle=False)
输入维度应该是什么样的?
回答:
问题出在你提供的目标(即标签)形状上(即Error when checking target
)。你的模型中LSTM层的输出,同时也是模型的输出,形状为(None, 1)
,因为你指定只返回最终输出(即return_sequences=False
)。为了获得每个时间步的输出,你需要设置return_sequences=True
。这样LSTM层的输出形状将变为(None, num_timesteps, num_units)
,这与你提供的标签数组的形状一致。