已经收集并组织了数据,如下所示:
一个观测值被组织成一个数据框
一个数据框由100行组成,按顺序排列。
每行有6个特征和1个标签
如何为LSTM模型重塑这些数据…?
my observation idx prod period qty label 0 Customer10 FG1 2483 200.000000 'A' 1 Customer11 FG2 2484 220.000000 'B' 2 Customer12 FG3 2485 240.000000 'C' 3 Customer13 FG1 2485 240.000000 'C' ... 100 Customer99 FG1 2485 240.000000 'A'
回答:
第一步是将数据框分成x和y变量。
你可以用一个简单的for循环来完成这个操作,我不知道具体的数据格式,所以我只能给出一个模板式的例子。
x = []y = []for i in dataframe: if Is_Label: y.append(i) else: x.append(i)
接下来,你需要将数组转换为numpy数组。使用导入为np
的numpy,你可以这样做:
x = np.array(x)y = np.array(y)
使用numpy,你可以使用.reshape
方法将数据重塑成你需要的格式。