我尝试让RESNet18处理float32数据。我使用的是torchvision中的RESNet模型(并使用pytorch lightning),并对其进行了修改以使用单层(灰度)数据,如下所示:
class ResNetMSTAR(pl.LightningModule):def __init__(self): super().__init__() # 定义模型和损失 self.model = resnet18(num_classes=3) self.model.conv1 = nn.Conv2d(1, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False) self.loss = nn.CrossEntropyLoss()@auto_move_data # 此装饰器会自动处理将张量移动到GPU(如果需要)def forward(self, x):return self.model(x)def training_step(self, batch, batch_no): # 实现单个训练步骤 x, y = batch logits = self(x) loss = self.loss(logits, y) return lossdef configure_optimizers(self): # 选择优化器 return torch.optim.RMSprop(self.parameters(), lr=0.005)
当我尝试运行这个模型时,遇到了以下错误:
File "/usr/local/lib64/python3.6/site-packages/torch/nn/functional.py", line 2824, in cross_entropy return torch._C._nn.cross_entropy_loss(input, target, weight, _Reduction.get_enum(reduction), ignore_index)RuntimeError: Expected object of scalar type Long but got scalar type Float for argument #2 'target' in call to _thnn_nll_loss_forward
有什么办法可以避免这个错误吗?
回答:
问题在于你传入交叉熵损失的y
不是LongTensor,而是一个FloatTensor。交叉熵期望目标是一个LongTensor,因此会引发这个错误。
这是一个不太优雅的解决方案:
x, y = batchy = y.long()
但我建议你去查看数据集定义的地方,确保你生成的是long类型的目标,这样即使你改变训练循环的工作方式,也不会再次出现这个错误。