Keras损失函数值错误:ValueError:操作的梯度为`None`,在LSTM网络上

我在尝试训练我的LSTM网络语言模型,并使用困惑度函数作为我的损失函数,但得到了以下错误:

ValueError: An operation has `None` for gradient. Please make sure that all of your ops have a gradient defined (i.e. are differentiable). Common ops without gradient: K.argmax, K.round, K.eval.

我的损失函数如下所示:

from keras import backend as Kdef perplexity_raw(y_true, y_pred):    """    困惑度指标。为什么这还没有成为Keras的一部分?!    https://stackoverflow.com/questions/41881308/how-to-calculate-perplexity-of-rnn-in-tensorflow    https://github.com/keras-team/keras/issues/8267    """#     cross_entropy = K.sparse_categorical_crossentropy(y_true, y_pred)    cross_entropy = K.cast(K.equal(K.max(y_true, axis=-1),                          K.cast(K.argmax(y_pred, axis=-1), K.floatx())),                  K.floatx())    perplexity = K.exp(cross_entropy)    return perplexity

我创建模型的方式如下:

# 定义模型model = Sequential()model.add(Embedding(vocab_size, 500, input_length=max_length-1))model.add(LSTM(750))model.add(Dense(vocab_size, activation='softmax'))print(model.summary())# 编译网络model.compile(loss=perplexity_raw, optimizer='adam', metrics=['accuracy'])# 训练网络model.fit(X, y, epochs=150, verbose=2)

当我尝试拟合模型时会出现错误。有人知道错误的原因和解决方法吗?


回答:

这些是罪魁祸首:K.argmaxK.max。它们没有梯度。我还认为你在损失度量中根本不需要它们!这是因为maxargmax操作会去掉关于预测错误程度的信息。

我不知道你想测量哪种损失,但我认为你可能在寻找像tf.exp(tf.nn.sigmoid_cross_entropy_with_logits(y_true, y_pred))tf.exp(tf.softmax_cross_entopy_with_logits(y_true, y_pred))这样的东西。你可能需要使用tf.one_hot将你的logits转换为独热编码。

Related Posts

如何对SVC进行超参数调优?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

如何在初始训练后向模型添加训练数据?

我想在我的scikit-learn模型已经训练完成后再…

使用Google Cloud Function并行运行带有不同用户参数的相同训练作业

我正在寻找一种方法来并行运行带有不同用户参数的相同训练…

加载Keras模型,TypeError: ‘module’ object is not callable

我已经在StackOverflow上搜索并阅读了文档,…

在计算KNN填补方法中特定列中NaN值的”距离平均值”时

当我从头开始实现KNN填补方法来处理缺失数据时,我遇到…

使用巨大的S3 CSV文件或直接从预处理的关系型或NoSQL数据库获取数据的机器学习训练/测试工作

已关闭。此问题需要更多细节或更清晰的说明。目前不接受回…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注