我正在尝试使用LSTM模型来预测天气(主要是为了学习LSTM和使用Python)。
我有一个包含500,000行的数据集,每行代表一个日期,并有8个特征列。
以下是我的模型。
model = Sequential() model.add(LSTM(50, input_shape=(30, 8), return_sequences=True)) model.add(Dropout(0.2)) model.add(LSTM(100, return_sequences=True)) model.add(Dropout(0.2)) model.add(LSTM(50, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(1)) model.add(Activation('linear')) model.fit( X, y, batch_size=512, epochs=100, validation_split=0.05)
就我对输入参数的理解,第一个参数是时间步长,所以我在这里表示认为应该使用最近的30个观测值来预测下一个值。8是特征数,比如气压、温度等。
所以我将X矩阵转换为3D矩阵,代码如下,因此X现在是500000, 8, 1的矩阵。
X = np.reshape(X, (X.shape[0], X.shape[1], 1))
然而,当我运行模型时,我得到了下面的错误。
ValueError: 检查输入时出错:期望
lstm_3_input
具有形状(30, 8),但得到的数组形状为(8, 1)
我做错了什么?
回答:
你的问题在于数据准备。关于LSTM的数据准备的详细信息可以在这里找到。
LSTM将过去观测的序列作为输入映射到输出观测。因此,必须将观测序列转换为多个样本。考虑一个给定的单变量序列:
[10, 20, 30, 40, 50, 60, 70, 80, 90]
我们可以将序列分成多个输入/输出模式,称为样本,其中使用三个n_steps
时间步作为输入,一个时间步作为标签,用于学习一步预测。
X, y10, 20, 30 4020, 30, 40 5030, 40, 50 60# ...
所以你想要做的是在下面的split_sequence()
函数中实现的:
# 将单变量序列分割成样本def split_sequence(sequence, n_steps): X, y = list(), list() for i in range(len(sequence)): # 找到该模式的结束点 end_ix = i + n_steps # 检查是否超出了序列 if end_ix > len(sequence)-1: break # 收集模式的输入和输出部分 seq_x, seq_y = sequence[i:end_ix], sequence[end_ix] X.append(seq_x) y.append(seq_y) return array(X), array(y)
回到我们最初的例子,以下情况会发生:
# 定义输入序列raw_seq = [10, 20, 30, 40, 50, 60, 70, 80, 90]# 选择时间步数n_steps = 3# 分割成样本X, y = split_sequence(raw_seq, n_steps)# 总结数据for i in range(len(X)): print(X[i], y[i])# [10 20 30] 40# [20 30 40] 50# [30 40 50] 60# [40 50 60] 70# [50 60 70] 80# [60 70 80] 90
总结:现在你的形状应该符合LSTM模型的期望,你应该能够根据需要调整数据形状。显然,这同样适用于多个输入特征行。