我的数据集由序列组成,每个序列中的时间步包含4个特征。示例如下:
S0:t0 -> f1, f2, f3, f4t1 -> f1, f2, f3, f4t2 -> f1, f2, f3, f4t3 -> f1, f2, f3, f4S1:t0 -> f1, f2, f3, f4t1 -> f1, f2, f3, f4t2 -> f1, f2, f3, f4t3 -> f1, f2, f3, f4t4 -> f1, f2, f3, f4t5 -> f1, f2, f3, f4t6 -> f1, f2, f3, f4t7 -> f1, f2, f3, f4etc...
如你所见,每个序列的长度是可变的,并且这种变动很大(从10到500不等)
我的目标是输入t0,并使用每次的预测结果来辅助下一次的预测,直到达到目标为止。
i0 -> [t0] - predicts > t1i1 -> [t0, t1] - predicts > t2i2 -> [t0, t1, t2] - predicts > t3and so on
我目前不确定如何在Keras中构建我的训练数据。我当前的’x’数据格式如下:
[ [[f1, f2, f3, f4], [f1, f2, f3, f4]] , [[f1, f2, f3, f4]] ] ...
问题:
-
在Keras中如何处理变长序列?
-
我应该如何格式化我的’y’预期输出数据?
-
是否有可能设置一个开始时间步和一个结束时间步,然后填充两者之间的时间步?
回答:
在Keras中如何处理变长序列?
Keras处理变长序列有很好的方法。例如,如果你使用LSTM层进行序列预测,你可以将输入形状的时间维度设置为None
model.add(LSTM(num_units,input_shape=(None, data_dim));
我应该如何格式化我的’y’预期输出数据?
你的y
可以看作是x
向左移动一个单位的结果。
例如:
# ifx = [t0,t1,t2,t3,t4]#then y = [t1,t2,t3,t4]
如果x
和y
都是numpy数组,你可以从x
中得到y
如下:
y = x[1:]
由于x
的最后一个值不会用于预测,你应该将其移除。
x = x[:-1]