在纯TensorFlow中使用有状态的Keras模型

我有一个在Keras中创建的包含多个GRU层的有状态RNN模型。

现在我需要从Java运行这个模型,因此我将模型导出为protobuf格式,并从Java TensorFlow中加载它。

这个模型必须是有状态的,因为特征将一次一个时间步地输入。

据我所知,为了在TensorFlow模型中实现有状态性,每次执行会话运行器时,我必须以某种方式输入最后的状态,并且运行结束后还会返回状态。

  1. 在Keras模型中,有没有办法输出状态?
  2. 有没有更简单的方法让有状态的Keras模型在TensorFlow中按这种方式工作?

非常感谢


回答:

好的,我成功解决了这个问题!

对我有效的方法是,不仅为输出创建tf.identity张量(这很常见),还为状态张量创建tf.identity张量。

在Keras模型中,可以通过以下方式找到状态张量:

model.updates

这会得到类似这样的结果:

[(<tf.Variable 'gru_1_1/Variable:0' shape=(1, 70) dtype=float32_ref>,  <tf.Tensor 'gru_1_1/while/Exit_2:0' shape=(1, 70) dtype=float32>), (<tf.Variable 'gru_2_1/Variable:0' shape=(1, 70) dtype=float32_ref>,  <tf.Tensor 'gru_2_1/while/Exit_2:0' shape=(1, 70) dtype=float32>), (<tf.Variable 'gru_3_1/Variable:0' shape=(1, 4) dtype=float32_ref>,  <tf.Tensor 'gru_3_1/while/Exit_2:0' shape=(1, 4) dtype=float32>)]

“Variable”用于输入状态,而“Exit”用于输出新状态。因此,我从“Exit”张量中创建了tf.identity。我给它们赋予了有意义的名称,例如:

tf.identity(state_variables[j], name='state'+str(j))

其中state_variables仅包含“Exit”张量

然后使用输入变量(例如gru_1_1/Variable:0)从TensorFlow中输入模型状态,而我从“Exit”张量中创建的identity变量用于在每个时间步输入模型后提取新状态

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注