训练损失的噪声

我正在训练一个基于注意力机制的编码器-解码器模型,批次…

如何有条件地为张量赋值[掩码用于损失函数]?

我想创建一个L2损失函数,该函数忽略标签值为0的数值(…

Tensorflow 多标签分类损失计算

我的标签看起来像这样 label = [0, 1, 0…

我们会在*测试*集上计算成本J(θ)吗?

我相当确定答案是否定的,但想确认一下… 在…

成本函数训练目标与期望的准确性目标

当我们训练神经网络时,通常使用梯度下降法,这依赖于一个…

如何通过梯度下降的反向传播表示每次前向传播后的误差

在神经网络多层感知器中,我理解随机梯度下降(SGD)和…

Keras – 负余弦接近度损失

我在Keras中有一个小型神经网络: contextT…

batch_loss和total_loss=tf.get_total_loss() 在TensorFlow中

我在阅读im2txt源代码时遇到了一个问题。 其中有b…

在Keras和TensorFlow中所有这些交叉熵损失函数之间有什么区别?

所有这些交叉熵损失函数之间有什么区别? Keras中提…

什么是损失函数?

能否用简单的话语,并可能通过一些例子来解释一下在机器学…

L1/L2正则化在PyTorch中的应用

如何在PyTorch中添加L1/L2正则化,而不需要手…

从头开始实现对比损失

我正在尝试实现/学习如何实现对比损失。目前我的梯度在爆…

如何在三元组损失中使用余弦相似度

三元组损失定义如下: L(A, P, N) = max…

我们是否应该主动使用损失函数中的权重参数

目前大多数机器学习库中的损失函数都带有一个权重参数,这…

为什么我的损失函数在每个周期中都在增加?

我刚开始学习机器学习,所以如果这个问题很傻,请原谅我。…

RMSE loss for multi output regression problem in PyTorch

我正在使用PyTorch训练一个CNN架构来解决一个回…

在训练神经网络时,训练数据和验证数据之间的损失差异在开始阶段有多重要?

简短问题:在训练初期(最初几个周期),验证损失和训练损…

激活函数的导数与损失函数的偏导数

AI中的一些术语让我感到困惑。反向传播中使用的导数函数…

在Python中实现梯度下降并遇到溢出错误

梯度下降与溢出错误 我目前正在Python中实现向量化…