我在理解 Keras 中 LSTM 的输入时遇到了麻烦。我如何将一个非常简单的序列 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 转换成一个输入矩阵,以便它可以预测下一个数字?
我找到了这个图表
我读了一些教程,他们说矩阵的形状像这样
[[0 1 2 3 4] [1 2 3 4 5] [2 3 4 5 6] [3 4 5 6 7] [4 5 6 7 8]]
我用以下代码实现了它
list1 = []for i in range(0, 10): list1.append(i)list2 = []list3 = []for i in range(0, len(list1) - 5): list2.append(list1[i:i + 5])list2 = np.array(list2)
但是,按照那个图表,矩阵的行和列分别代表什么?
回答:
Keras 的 LSTM 层有以下调用参数 文档 :
调用参数:
inputs: 一个形状为 [batch, timesteps, feature] 的 3D 张量。
你提供的矩阵是 2D 形状 (5, 5)
,即 5 行和 5 列。
因为你在使用 LSTM,让我给你举个文本数据的例子:
猫坐在狗上
上面的句子有 5 个单词,每个单词可以被向量化为 5 个维度(词嵌入)。这使得你的句子变成一个形状为 (5,5)
的 2D 张量。现在你可以有多个句子。
- 狗坐在猫上
- 猫吃了狗粮
- 狗吃了猫粮
所以现在你有总共 4 个句子,这就是你的批次。这 4 个句子中的每一个都将有一个形状为 (5,5)
的张量,因为它们都包含 5 个单词,并且你用 5 个维度对每个单词进行编码。
因此,你的整个数据集的形状为:
[batch, timesteps, feature] == [4, 5, 5]
你现在可以将这个 3D 张量输入到你的 LSTM 层中。
如果你只想输入那个 2D 矩阵,你需要使用 np.expand_dims() 扩展维度,使其成为形状为 (1, 5, 5)
的 3D 形状
list2 = np.expand_dim(list2, axis=0)print(list2)print(list2.shape)
[[[0 1 2 3 4] [1 2 3 4 5] [2 3 4 5 6] [3 4 5 6 7] [4 5 6 7 8]]](1, 5, 5)
另请参考 理解 Keras 的 LSTM