我正在训练一个LSTM模型,输入是一系列50个步骤的3个不同特征,排列如下:
#x_train[[[a0,b0,c0],.....[a49,b49,c49]], [a1,b1,c1]......[a50,b50,c50]], ... [a49,b49,c49]...[a99,b99,c99]]]
使用以下依赖变量
#y_train[a50, a51, a52, ... a99]
下面的代码可以预测a,如何让它预测并返回给定时间步的[a,b,c]向量?
def build_model():model = Sequential()model.add(LSTM( input_shape=(50,3), return_sequences=True, units=50))model.add(Dropout(0.2))model.add(LSTM( 250, return_sequences=False))model.add(Dropout(0.2))model.add(Dense(1))model.add(Activation("linear"))model.compile(loss="mse", optimizer="rmsprop")return model
回答:
每一层的输出基于它所拥有的单元/单元数/滤波器的数量。
你的输出只有一个特征,因为Dense(1...)
只有一个单元。
只需将其改为Dense(3...)
就能解决你的问题。
现在,如果你希望输出与输入具有相同的时间步数,那么你需要在所有的LSTM层中开启return_sequences = True
。
LSTM的输出是:
- (批次大小, 单元数) – 当
return_sequences=False
- (批次大小, 时间步数, 单元数) – 当
return_sequences=True
然后你可以在后续的层中使用TimeDistributed
层包装器,让它们也像是具有时间步数的层(它基本上会保留中间的维度)。
def build_model(): model = Sequential() model.add(LSTM( input_shape=(50,3), return_sequences=True, units=50)) model.add(Dropout(0.2)) model.add(LSTM( 250, return_sequences=True)) model.add(Dropout(0.2)) model.add(TimeDistributed(Dense(3))) model.add(Activation("linear")) model.compile(loss="mse", optimizer="rmsprop") return model