我使用CreateML创建了一个图像分类模型。
训练集中标记大致如下:
- 图像包含对象A -> 标签a
- 图像包含对象B -> 标签b
- 图像包含对象C -> 标签c
- 图像包含对象A + B -> 标签a
- 图像包含对象A + B + C -> 标签c
可以说对象之间存在某种“优先级”,其中对象A的优先级高于B,因此应应用标签a。同理,对象C具有最高优先级,应应用标签c。
显然,这对算法来说并不最优,因此我会使用更适合的对象识别算法。但我已经拥有一个包含数十万张手动正确分类的图像的庞大数据集,这些数据无法用于训练新算法,我需要从头开始构建一个新的训练集用于对象检测,这显然是一个成本问题,并且在短期内无法达到现有数据集的规模。
有没有一种方法可以利用现有的数据集来构建图像分类模型,并用我手动从头构建的对象检测模型进行增强,尽管后者的数据集可能只有几百个项目?
回答:
一种解决方法是使用多标签分类,其中模型会告诉您A存在的概率,B存在的概率,以及C存在的概率,但这些概率是相互独立的。不幸的是,Create ML无法训练这种类型的模型。