我目前使用partial_fit
和SGDClassifier来训练一个模型,以预测图像上的标签(hashtags)。
我遇到的问题是SGDClassifier需要提前指定classes
。这对于离线训练模型是可以的,但我希望在观察到新的标签时能够在线添加新类别。目前,我需要从头开始重新训练一个新模型来适应这些新类别。
有没有办法让SGDClassifier接受新类别而无需重新训练新模型?或者我是否应该为每个标签训练一个单独的二元SGDClassifier?
谢谢
回答:
标签通常只是标签,因此一个对象可以有多个标签。在这种情况下不存在多类别场景——你应该为每个标签只使用一个二元SGD分类器。当然,你可以训练更复杂的模型来考虑标签之间的关系,但SGD并不这样做,因此在给定的设置中使用它并不比拥有N个不同的分类器更有意义。