我使用自定义数据集在yoloV5s模型上进行了训练,推理准确率达到了80%。现在我需要通过增加更多图像和标签来提高准确率。
我的问题是,我已经训练了10,000多个标签才达到80%的准确率,这花费了我7个小时。我是否需要将旧的10,000多条数据与新的1000条数据一起训练以提高准确率?
有没有办法只使用新数据重新训练模型,即使我添加了新的类别?
我怎样才能节省时间和空间?
回答:
你所问的问题属于持续学习领域,这是当前研究的热点领域。由于你需要向模型中添加更多类别,你需要将新类别与之前的数据一起加入,并从头开始重新训练模型。如果不这样做,即只训练新类别,你的模型将完全忘记之前的数据(学习到的特征);这种遗忘现象被称为灾难性遗忘。
许多人已经提出了各种方法来避免这种灾难性遗忘;我个人认为渐进式神经网络对遗忘有很强的免疫力。除此之外,你还可以在这里找到其他方法。
正如我所说,这是一个当前非常活跃的研究领域;没有完全可靠的解决方案。目前,最好的方法是将新数据添加到之前的数据中,并重新训练你的模型。