我在进行一个深度学习任务时,希望利用一些部分标记的数据。我采用的是全卷积方法,而不是从标记区域中抽取样本块。
我有掩码,用于勾勒出图像中确定的正例区域,但图像中未被掩码的区域不一定是负例——它们可能是正例。有人知道如何在深度学习环境中纳入这种类型的类别吗?
三元/对比损失似乎可能是解决方案,但我不确定如何适应这种“模糊”或不明确的负/正空间。
回答:
尝试使用《深度学习书》第7.5.1节中描述的标签平滑方法:
我们可以假设,对于某个小的常数
eps
,训练集标签y正确的概率为1 - eps
,否则任何其他可能的标签都有可能是正确的。标签平滑通过用
eps / k和1 - (k - 1) / k * eps
分别替换硬0和1分类目标,对基于k
个输出值的softmax模型进行正则化。
关于在Pandas中实现标签平滑,请参见我的问题在这里。
否则,如果你确定某些区域是负的,其他是正的,而有些是不确定的,那么你可以引入第三个不确定类。我曾经处理过包含不确定类的数据集,这些样本可能属于任何可用的类别。