我正在尝试创建一个 GAN,它接受一张低分辨率的图像,并试图从中生成一张高分辨率的图像。为此,我需要使用一个 Dataloader,它同时存储了高分辨率和低分辨率的训练图像。
data_transform = transforms.Compose([transforms.Resize(imageSize), transforms.Grayscale(num_output_channels=1), transforms.ToTensor()]) dataset_hi = "./hi-res-train" dataset_lo = "./low-res-train" img_data_hi = dset.ImageFolder(root=dataset_hi,transform=data_transform) img_data_lo = dset.ImageFolder(root=dataset_lo,transform=data_transform) dataloader_hi = torch.utils.data.DataLoader(img_data_hi, batch_size = batchSize, shuffle = True, num_workers = 2) dataloader_lo = torch.utils.data.DataLoader(img_data_lo, batch_size = batchSize, shuffle = True, num_workers = 2)
我尝试使用了两个独立的数据加载器(如上所示),但当它们被打乱时,我无法同时枚举它们,因为高分辨率和低分辨率的图像没有匹配。如何才能使用 pytorch 同时枚举和打乱它们呢?
回答:
假设你对高分辨率和低分辨率的图像使用了相似的命名方式(例如 img01_hi 和 img01_low),一种方法是创建一个自定义的 Dataloader,通过重写 __getitem__
方法来返回两张图像。
由于一次调用返回两张图像,你可以通过在文件名后添加 _hi 和 _low 来确保它们匹配。
你可能需要创建一个包含所有图像文件名的“提示”文本文件,以确保每个图像文件只处理一次。