在纯TensorFlow中使用有状态的Keras模型

我有一个在Keras中创建的包含多个GRU层的有状态RNN模型。

现在我需要从Java运行这个模型，因此我将模型导出为protobuf格式，并从Java TensorFlow中加载它。

这个模型必须是有状态的，因为特征将一次一个时间步地输入。

据我所知，为了在TensorFlow模型中实现有状态性，每次执行会话运行器时，我必须以某种方式输入最后的状态，并且运行结束后还会返回状态。

在Keras模型中，有没有办法输出状态？
有没有更简单的方法让有状态的Keras模型在TensorFlow中按这种方式工作？

非常感谢

回答：

好的，我成功解决了这个问题！

对我有效的方法是，不仅为输出创建tf.identity张量（这很常见），还为状态张量创建tf.identity张量。

在Keras模型中，可以通过以下方式找到状态张量：

model.updates

这会得到类似这样的结果：

[(<tf.Variable 'gru_1_1/Variable:0' shape=(1, 70) dtype=float32_ref>,  <tf.Tensor 'gru_1_1/while/Exit_2:0' shape=(1, 70) dtype=float32>), (<tf.Variable 'gru_2_1/Variable:0' shape=(1, 70) dtype=float32_ref>,  <tf.Tensor 'gru_2_1/while/Exit_2:0' shape=(1, 70) dtype=float32>), (<tf.Variable 'gru_3_1/Variable:0' shape=(1, 4) dtype=float32_ref>,  <tf.Tensor 'gru_3_1/while/Exit_2:0' shape=(1, 4) dtype=float32>)]

“Variable”用于输入状态，而“Exit”用于输出新状态。因此，我从“Exit”张量中创建了tf.identity。我给它们赋予了有意义的名称，例如：

tf.identity(state_variables[j], name='state'+str(j))

其中state_variables仅包含“Exit”张量

然后使用输入变量（例如gru_1_1/Variable:0）从TensorFlow中输入模型状态，而我从“Exit”张量中创建的identity变量用于在每个时间步输入模型后提取新状态

学技术

在纯TensorFlow中使用有状态的Keras模型

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复