我有一个在Keras中创建的包含多个GRU层的有状态RNN模型。
现在我需要从Java运行这个模型,因此我将模型导出为protobuf格式,并从Java TensorFlow中加载它。
这个模型必须是有状态的,因为特征将一次一个时间步地输入。
据我所知,为了在TensorFlow模型中实现有状态性,每次执行会话运行器时,我必须以某种方式输入最后的状态,并且运行结束后还会返回状态。
- 在Keras模型中,有没有办法输出状态?
- 有没有更简单的方法让有状态的Keras模型在TensorFlow中按这种方式工作?
非常感谢
回答:
好的,我成功解决了这个问题!
对我有效的方法是,不仅为输出创建tf.identity张量(这很常见),还为状态张量创建tf.identity张量。
在Keras模型中,可以通过以下方式找到状态张量:
model.updates
这会得到类似这样的结果:
[(<tf.Variable 'gru_1_1/Variable:0' shape=(1, 70) dtype=float32_ref>, <tf.Tensor 'gru_1_1/while/Exit_2:0' shape=(1, 70) dtype=float32>), (<tf.Variable 'gru_2_1/Variable:0' shape=(1, 70) dtype=float32_ref>, <tf.Tensor 'gru_2_1/while/Exit_2:0' shape=(1, 70) dtype=float32>), (<tf.Variable 'gru_3_1/Variable:0' shape=(1, 4) dtype=float32_ref>, <tf.Tensor 'gru_3_1/while/Exit_2:0' shape=(1, 4) dtype=float32>)]
“Variable”用于输入状态,而“Exit”用于输出新状态。因此,我从“Exit”张量中创建了tf.identity。我给它们赋予了有意义的名称,例如:
tf.identity(state_variables[j], name='state'+str(j))
其中state_variables
仅包含“Exit”张量
然后使用输入变量(例如gru_1_1/Variable:0
)从TensorFlow中输入模型状态,而我从“Exit”张量中创建的identity变量用于在每个时间步输入模型后提取新状态