我有一个关于机器学习中时间序列预测的一般问题。这还不是关于编码的问题,我只是想了解如何构建模型。
以下是我与模型相关的部分代码:
def build_model(my_learning_rate, feature_layer): model = tf.keras.models.Sequential() model.add(feature_layer) model.add(tf.keras.layers.Dense(units=64, activation="relu")) model.add(tf.keras.layers.Dense(units=1)) model.compile(optimizer=tf.keras.optimizers.RMSprop(lr=my_learning_rate), loss="mean_squared_error", metrics=[tf.keras.metrics.RootMeanSquaredError()]) return model
这是我的特征层:
<tf.Tensor: shape=(3000, 31), dtype=float32, numpy=array([[0., 0., 1., ..., 0., 0., 0.], [0., 0., 1., ..., 0., 0., 0.], [0., 0., 1., ..., 0., 0., 0.], ..., [0., 0., 1., ..., 1., 0., 0.], [0., 0., 1., ..., 0., 1., 0.], [0., 0., 1., ..., 0., 0., 1.]], dtype=float32)>
我最近学到的时间序列预测建模技术与我之前构建模型的方式完全不同。该技术涉及使用时间窗口,将过去的值(我的标签!)作为特征,并将下一个值作为标签。它还涉及RNN和LSTM。
我构建的模型方式与时间序列预测技术在根本上是不同的,并且会产生不同的结果吗?我之前的建模方式合理,还是应该转向适当的时间序列预测方法?
回答:
是的,通常使用LSTM和循环层来进行时间序列预测,因为来自之前时间戳的数据对于创建成功的模型以进行准确和精确的预测至关重要。例如,当我为时间序列模型构建模型时,我通常使用时间分布的一维卷积层。代码如下:
model = Sequential()model.add(TimeDistributed(Conv1D(filters=64, kernel_size=1, activation='relu'),input_shape=(None, n_steps, n_features)))model.add(TimeDistributed(Flatten()))model.add(LSTM(100, activation='relu'))model.add(BatchNormalization())model.add(Dense(1))
如果你想自己实现这个,你必须将原始的X数组重塑为n_steps(时间戳)和n_features(数据中的特征数量)。
希望这对你有帮助!