如何用PyTorch仅用标量损失来训练神经网络？

假设我们有一个神经网络，我们希望它能根据输入预测三个值。我们有一组训练数据：

x_train = ((1, 5, 3, 2, 6), (1, 8, 6, 9, 3), ...)

以及目标值

y_train = ((25, 32, 0.12), (.125, -5, 8), ...)

如果PyTorch只计算一个标量作为损失函数，它是如何进行训练的呢？为什么它不能计算与每个输出神经元相关的损失呢？例如，如果x_train[0]的答案是(20, 32, 0.12)，我们不希望更新与答案(25, 37, 0.12)相同的权重，对吗？但在这种情况下，PyTorch计算的损失将是相同的，因为对于经典的均方误差损失来说，它将意味着所有错误的总和。

PyTorch如何在不知道错误来源的情况下正确地训练神经网络呢？

回答：

你的问题并不仅限于PyTorch，而是关于一般的神经网络训练。

最终，每次训练都需要最小化损失。损失可以是多种形式，但最终必须是标量，因为最小化一个向量是模糊的。

神经网络的优化器不仅计算损失，还计算该损失相对于神经网络所有可训练参数的梯度。所以，简单来说（不涉及大量方法），对损失影响大的参数会发生较大的变化，而对损失影响小的参数几乎不会改变。

这样，它就能某种程度上知道“错误来自哪里”。

学技术

如何用PyTorch仅用标量损失来训练神经网络？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复