我正在尝试将这个模型移植到Keras
v2,但我在处理以下函数时遇到了问题:
def __call__(self, sent1, sent2): def _outer(AB): att_ji = K.batch_dot(AB[1], K.permute_dimensions(AB[0], (0, 2, 1))) return K.permute_dimensions(att_ji, (0, 2, 1)) return merge([self.model(sent1), self.model(sent2)], mode=_outer, output_shape=(self.max_length, self.max_length))
根据文档,mode
是:
字符串或lambda/函数。如果是字符串,必须是以下之一:’sum’, ‘mul’, ‘concat’, ‘ave’, ‘cos’, ‘dot’, ‘max’。如果是lambda/函数,它应该接受一个张量列表作为输入,并返回一个单一的张量。
在新的Keras
版本中,模式为函数/lambda时的等效函数是什么,以避免以下警告:
UserWarning: The `merge` function is deprecated and will be removed after 08/2017. Use instead layers from `keras.layers.merge`, e.g. `add`, `concatenate`, etc. return merge([attention, sentence], mode=_normalize_attention, output_shape=(self.max_length, self.nr_hidden))
回答:
这似乎是一种奇怪的模型实现方式……(至少在keras 2中是这样的…)
看起来你应该使用带有自定义函数的lambda层。
def __call__(self, sent1, sent2): def _outer(AB): #自定义函数 att_ji = K.batch_dot(AB[1], K.permute_dimensions(AB[0], (0, 2, 1))) return K.permute_dimensions(att_ji, (0, 2, 1)) return Lambda(_outer, output_shape=(self.max_length,self.max_length))([ self.model(sent1), self.model(sent2)])
如果self.model(sent)
返回由keras层创建的张量,这应该可以工作。
现在,关于实际的合并层,在keras 2中你有以下层:
- Concatenate(axis=…)(listOfTensors)
- Add()(listOfTensors)
- Multiply()(listOfTensors)
- 以及其他,包括
Dot
层,它“可能”与那个函数执行相同的操作。
如果使用dot层:
return Dot()([self.model(sent1),self.model(sent2)])
这需要测试。Keras中的Dot和batch dot是容易混淆的东西。