我有一个预训练的模型,具有不同形状的多个输入。因此,我可以对形状匹配的新输入调用模型,如下所示:
new_output = model([input_1, input2])
其中
input_1.shape = (400, 200)input_2.shape = (400, 200, 10)
我想重用模型来训练一个数据序列,因此我的新输入将具有以下形状:
input_1.shape = (100, 400, 200)input_2.shape = (100, 400, 200, 10)
为了重用模型,我想要使用Keras中的TimeDistributed
层,像这样:
output = TimeDistributed(model)([input_1, input_2])
这不起作用,因为TimeDistributed
不接受列表作为输入。我找到的所有解决方案都是使用合并输入来解决这个问题,但这种解决方案在我这里不起作用,因为输入形状不同。
我也尝试使用一些Lambda
层,像这样:
lambda_0 = Lambda(lambda x: x)lambda_1 = Lambda(lambda x: [TimeDistributed(lambda_0)(x[0]), TimeDistributed(lambda_0)(x[1])])([input_1, input_2])output = model(lambda_1)
但这不起作用,因为它只是在lambda_0
上使用了TimeDistributed
,而不是在模型上。也许有使用Lambda
包装器的解决方案,或者我可能需要定义一个自定义的Keras层,但目前我被这个问题困住了,所以我非常感谢任何帮助。
回答:
你可以轻松地将(?, 400, 200)
重塑为(?, 400, 200, 1)
,然后连接两个输入以得到形状为(?, 400, 200, 11)
的张量,然后将此张量输入到一个包装在TimeDistributed
层中的Lambda
层,因此在每个时间步应用你的模型:
in1 = Input((400, 200))in2 = Input((400, 200, 10))r_in1 = Reshape((400, 200, 1))(in1) # 你也可以在Lambda层中使用`K.expand_dims()`concat = concatenate([r_in1, in2])out_model = TimeDistributed(Lambda(lambda x: model([x[:,:,0], x[:,:,1:]])))(concat)new_model = Model([in1, in2], [out_model])