我正在努力解决 LSTM 的 input_shape 问题。我创建了一个简单的 LSTM 网络,目的是训练它将输入翻倍。
from keras.models import Sequentialfrom keras.layers import LSTM, Denseimport numpy as npX = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])y = np.array([2, 4, 6, 8, 10, 12, 14, 16, 18, 20])data_dim = 1timesteps = 8model = Sequential()model.add(LSTM(32, return_sequences=True, input_shape=(timesteps, data_dim)))model.add(LSTM(32, return_sequences=True))model.add(Dense(10, activation='softmax'))model.compile(loss='categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy'])model.fit(X,y, batch_size=10, epochs=1000)
但总是出现这个错误信息:ValueError: 检查输入时出错:预期 lstm_1_input 具有 3 个维度,但得到的数组形状为 (10, 1)我做错了什么?有人能解释一下 input_shape 的事情吗?此致敬礼。Niklas
回答:
你的代码中有几个问题需要解决。
1) 你希望解决的是回归问题。在最后一层,softmax 会将数字压缩到 0 和 1 之间。你需要一个线性激活函数。
2) 因此,损失函数应为 mean_square_error
。
3) 你的目标 y
的形状决定了每个时间步的输出层大小应为 1 而不是 10。
4) LSTM 层的输入和输出数组的形状应为 (batch_size, time_step, dim)。
5) LSTM 层中定义的时间步和输入数据的时间步应相同。
我对你的代码进行了这些修改:
from keras.models import Sequentialfrom keras.layers import LSTM, Denseimport numpy as npX = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])y = np.array([2, 4, 6, 8, 10, 12, 14, 16, 18, 20])X = X.reshape(1,10,1)y = y.reshape(1,10,1)data_dim = 1timesteps = 10model = Sequential()model.add(LSTM(32, return_sequences=True, input_shape=(timesteps, data_dim)))model.add(LSTM(32, return_sequences=True))model.add(Dense(1, activation='linear'))print(model.summary())model.compile(loss='mean_squared_error', optimizer='rmsprop', metrics=['accuracy'])model.fit(X,y, batch_size=1, epochs=1000)