我有一个数据集,包含RGB图像和作为真实标签的分割图像,注释数据集中包含的readme.txt文件中说明了以下内容:
GT_color:包含语义分割地面真实掩码的文件夹。注释使用颜色表示,每种颜色对应一个特定的类别。这主要用于可视化。对于训练,按照下面的说明,将颜色分配给特定的类别ID,创建相应的ID图像。
类别 R G B ID Void - - - 0 Road 170 170 170 1 Grass 0 255 0 2 Vegetation 102 102 51 3 Tree 0 60 0 3 Sky 0 120 255 4 Obstacle 0 0 0 5
我不理解“创建相应的ID图像”是什么意思,分割图像不是已经通过每个区域的颜色进行标记了吗?也就是说,RGB就是标签?
回答:
据我所知,你的分割图像包含3个通道,其中每个像素的颜色对应其真实标签。
当你训练图像分割模型时,不需要输出3个通道(这是多余的),所以他们建议你创建一个新的注释图像,将每种颜色替换为提供的ID。
这个建议只是为了让模型的工作稍微容易一些。