计算用于循环神经网络RTRL训练的偏导数

首先,嗨,
其次,现在是凌晨3点,我保证我已经筋疲力尽了,花了整整三天的时间来理解RNN和RTRL,但此时我的微积分思维已经离我而去。

基本上,我现在到了需要计算这个的阶段:

更具体地说:

我使用了各种网站和我的教科书(关于这个主题的内容为零),但这是我的主要来源的其余部分 willamette.edu

我遇到的问题是如何以编程方式(Java)对Yk在Wij方向上进行偏微分

我无法理解如何去做这件事。
注意:我确实自信地理解RNN和RTRL是如何工作的。


回答:

你不是“以编程方式(Java)进行偏微分”,你是通过分析来做这件事,然后实现简单的解决方案。所有这些操作在任何与神经网络相关的书籍中都有描述。

特别是,拥有 d y_k(t)/d w_ij。假设(为了简化)这是一个单层网络,那么y_k(t)w_ij的函数,y_k(t)的形式为y_k(t) = f( sum w_ij x_j(t) )(我将偏置表示为一个神经元)。因此,计算偏导数会得到f'( sum w_ij x_j(t) ) * x_j(t)

在进入RTRL之前,你应该首先理解简单的时间反向传播,这需要先理解简单的反向传播。然后,你可以进入RTRL – 我推荐你参考这个教程

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注