我有一个数据集,其形状为 (9430, 12)
。问题出现在拟合时:所有 12
个特征都是我的 X
和 Y
。我的意思是,这是一个在线学习模型,我训练 data[i]
,然后预测 data[i+1]
。所以如你所见,并且正如我之前所说,Y = X
。
data.shape = (9430, 12)Y = X = data.valuesmodel.fit(X, Y)
这样做不对吗?如果是,那我应该如何训练它?
回答:
我理解你的目标是,在每个时间步,你希望预测下一个时间步的输入。
目前,你尝试预测的输出与你传递的输入相同。鉴于Y[0] = X[0], Y[1] = X[1],依此类推。
你应该在Ys矩阵中将窗口框架移动一个单位。例如,假设X是一个numpy数组,你可以这样做:
import tensorflow as tfY = tf.concat((np.copy(X[1:,:]),np.zeros((1,12))), axis=0)X = tf.convert_to_tensor(X)
这段代码将实现:Y[0] = X[1] , Y[1] = X[2],这是能够在每个点预测下一个点的期望输出。
一旦你准备好这两个张量,你就可以用Tensorflow或Keras来拟合你的模型。请注意,Ys矩阵的最后一行只是一个填充的0行,因为你不知道下一步的真实值。可能在进行训练时,你应该从数据集中跳过这一行。
此外,对于预测序列数据,循环神经网络(如LSTM,长短期记忆)更为合适。我建议你研究一下它们 🙂