我正在使用PyTorch训练一个CNN架构来解决一个回归问题,我的输出是一个包含20个值的张量。我计划使用RMSE作为模型的损失函数,并尝试使用PyTorch的nn.MSELoss()
,然后使用torch.sqrt()
来计算其平方根,但得到结果后我感到困惑。我将尽力解释原因。显然,对于批量大小bs
,我的输出张量的维度将是[bs, 20]
。我尝试实现自己的RMSE函数:
def loss_function (predicted_x , target ): loss = torch.sum(torch.square(predicted_x - target) , axis= 1)/(predicted_x.size()[1]) #通过除以输出数量(在我这里是20)来计算所有平方的均值 loss = torch.sqrt(loss) loss = torch.sum(loss)/predicted_x.size()[0] #通过批量大小进行平均 return loss
但是,我的loss_function()
的输出与PyTorch使用nn.MSELoss()
实现的方式不同。我不确定是我的实现有误,还是我错误地使用了nn.MSELoss()
。
回答:
MSE损失是错误平方的均值。你在计算MSE后取了平方根,因此无法将你的损失函数的输出与PyTorch的nn.MSELoss()
函数的输出进行比较——它们计算的是不同的值。
然而,你可以使用nn.MSELoss()
来创建你自己的RMSE损失函数,如下所示:
loss_fn = nn.MSELoss()RMSE_loss = torch.sqrt(loss_fn(prediction, target))RMSE_loss.backward()
希望这对你有帮助。