我在Keras中构建了一些简单的模型以提升我在深度学习方面的知识,但在调试时遇到了一些我不太理解的问题。
我想使用一维卷积神经网络(1D CNN)对一些时间序列数据进行回归分析。我的输入特征张量的形状为N x T x D
,其中N是数据点的数量,T
是序列的数量,D
是维度的数量。我的目标张量的形状为N x T x 1
(1是因为我试图输出一个标量值)。
我设置了如下的模型架构:
feature_tensor.shape# (75584, 40, 38)target_tensor.shape# (75584, 40, 1)inputs = Input(shape=(SEQUENCE_LENGTH,DIMENSIONS))conv1 = Conv1D(filters=64, kernel_size=3, activation='relu')x = conv1(inputs)x = MaxPooling1D(pool_size=2)(x)x = Flatten()(x)x = Dense(100, activation='relu')(x)predictions = Dense(1, activation="linear")(x)model = Model(inputs, predictions)opt = Adam(lr=1e-5, decay=1e-4 / 200)model.compile(loss="mean_absolute_error", optimizer=opt)
然而,当我尝试训练模型时,我得到了以下输出:
r = model.fit(cleaned_tensor, target_tensor, epochs=100, batch_size=2058)
ValueError: 在检查目标时出错:预期dense_164有2个维度,但得到的数组形状为(75584, 40, 1)。
前两个数字很熟悉:75584是样本数量,40是序列长度。
当我调试我的模型摘要对象时,我看到来自Flatten
层的预期输出应该是1216
:
然而,我和我的同事盯着代码看了很长时间,无法理解为什么通过架构到达密集层时会得到(75584, 40, 1)
的形状。
能有人指导一下我做错了什么吗?
回答:
尝试将你的目标变量重塑为N x T,看起来你的最后一个密集层应该是40而不是1(我认为)。