我正在使用一个自定义数据集,包含不同大小的Lab格式(亮度,a,b)的图像,这些图像被输入到CNN中。输入层有3个输入通道,因此我的想法是将所有3个通道(L, a, b)分开,然后输入到网络中。接下来我就在想,每个张量是否需要转置?我担心这样做会丢失图像的尺寸,而这些尺寸在不同图像之间是可变的,最终我将无法重建图像。关于如何标准化图像,您有什么想法或建议吗?
回答:
您可以进行标准化处理,而不需要转置图像或根据通道进行分割
torchvision.transforms.Normalize(mean=[l_channel_mean, a_channel_mean , b_channel_mean], std= [l_channel_mean, a_channel_mean , b_channel_mean])
唯一需要的转换是将图像转换为张量的转换:torchvision.transforms.ToTensor()