我需要避免从网络上下载模型(因为安装机器上的限制)。
下面的代码可以工作,但它会从互联网上下载模型
model = torch.hub.load('pytorch/vision:v0.9.0', 'deeplabv3_resnet101', pretrained=True)
我已经将.pth
文件和hubconf.py
文件放置在/tmp/文件夹中,并将我的代码改为
model = torch.hub.load('/tmp/', 'deeplabv3_resnet101', pretrained=True, source='local')
但令我惊讶的是,它仍然从互联网上下载模型。我做错了什么?如何才能在本地加载模型?
为了给你提供更多细节,我在Docker容器中进行所有这些操作,该容器在运行时具有只读卷,这就是为什么无法下载新文件的原因。
回答:
在没有互联网连接的机器上获取可部署的模型,有两种方法可以尝试。
-
在一个正常的机器上加载带有预训练模型的DeepLab,使用JIT编译器将其导出为图形,并将其放入机器中。脚本很容易遵循:
# 导出模型 model = torch.hub.load('pytorch/vision:v0.9.0', 'deeplabv3_resnet101', pretrained=True).eval() traced_graph = torch.jit.trace(model, torch.randn(1, 3, H, W)) traced_graph.save('DeepLab.pth') # 加载模型 model = torch.jit.load('DeepLab.pth').eval().to(device)
在这种情况下,权重和网络结构被保存为计算图,因此您不需要任何额外的文件。
-
有一个下载URL用于DeepLabV3与Resnet101主干的权重。
您可以下载这些权重一次,然后使用torchvision中的deeplab,设置pretrained=False标志,并手动加载权重。
model = torch.hub.load('pytorch/vision:v0.9.0', 'deeplabv3_resnet101', pretrained=False) model.load_state_dict(torch.load('downloaded weights path'))
请注意,状态字典中可能有一个[‘state_dict’]或类似的父键,在这种情况下,您将使用:
model.load_state_dict(torch.load('downloaded weights path')['state_dict'])