这是一个单变量时间序列预测问题。如下面的代码所示,我将初始数据分为训练数据集(trainX
)和测试数据集(testX
),然后我使用keras创建了一个LSTM网络。接下来,我用训练数据集训练模型。然而,当我想获取预测时,我需要知道测试值,所以我的问题是:既然我已经知道这个问题的真实值,即测试数据集,为什么还要预测呢?我想要的是未来时间的预测值?如果我对LSTM网络有任何误解,请告诉我。
谢谢你!
# 创建并拟合LSTM网络
model = Sequential()
model.add(LSTM(4, input_shape=(1, look_back)))
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer='adam')
model.fit(trainX, trainY, epochs=100, batch_size=1, verbose=2)
# 进行预测
trainPredict = model.predict(trainX)
testPredict = model.predict(testX)
回答:
既然我已经知道这个问题的真实值,即测试数据集,为什么还要预测呢?我想要的是未来时间的预测值?
在机器学习中,我们提供测试数据X,它会返回给我们Y。在时间序列的情况下,这可能会让初学者有些误解,因为我们使用X,并且输出表面上看也是X:这里的区别在于,我们输入的是时间序列的旧值作为X,而输出Y是同一时间序列的未来值(也可以应用于现在甚至过去),正如你正确地指出的那样。
(附注:如果你只是想学习机器学习,我建议你从简单的回归开始,然后再学习LSTM等。)