我有一组关于某种皮肤疹的图片数据集,这些图片由医生根据他们对疹子可能是“莱姆病”的可能性进行排序。因此,数据集包括“50-70%”、“70-80%”、“80-90%”、“90-100%”等文件夹。例如,“90-100%”文件夹中的图片最可能是“莱姆病”,依此类推。
我想使用所有这些数据,但我不知道如何告诉神经网络这个文件夹中的图片肯定是“莱姆病”,而其他文件夹中的图片可能性较小。这是否可能呢?
回答:
@人名,这完全取决于你的需求,
1)如果你只是想让模型知道“莱姆病”或“不是莱姆病”,
你可以设定一个界限,比如80%以上的都归为莱姆病,80%以下的则不是莱姆病,
这样你可以将所有80%以下的图片输出设为0,80%以上的图片输出设为1
2)如果你希望模型更详细,区分不同的级别,你可以这样做
“90-100%” — 有莱姆病 [1,0,0,0]
“80-90%” — 高风险 [0,1,0,0]
“70-80%” — 无风险 [0,0,1,0]
“50-70%” — 无莱姆病 [0,0,0,1]
相应地,你可以有分类输出