我正在尝试实现一个包含5个不同类别的多类别语义分割模型。有些图像拥有所有5个类别的地面真实掩码,有些则没有。例如,下面的图像就包含了所有5个不同类别的地面真实掩码。输入图像描述
我的问题是,如果我有下面这样的图像需要训练,但图像中没有任何类别。我是否应该仍然使用填充了全部零值的5个通道来训练这张图像?这样做能有效地训练模型,减少误报吗?输入图像描述
提前感谢!
回答:
你的直觉很好。
如果你使用所有数据进行训练,模型可能会减少误报;但与此同时,误报的数量也可能会增加,因为模型对你希望在CT扫描中预测的重要类别会变得不那么确定。
为了验证你的假设,你必须使用两个不同的数据集来训练同一个神经网络:
- 一个包含所有数据的数据集。这里的不平衡性会更大。最终,每个医学分割问题本质上都是高度不平衡的,尤其是当你有未标记任何感兴趣类别的掩码时。在你的情况下,不平衡性更为明显:根据你问题的性质,你的5个类别与背景/感兴趣的类别之间可能存在不平衡。
- 一个只包含标记了你试图预测的类别的掩码的数据集。
然后,在你的测试集上测试这些模型,看看哪个在处理误报/漏报方面表现得更好。