我试图利用一个预训练的模型,如Inception v3(在2012年ImageNet数据集上训练),并将其扩展到几个缺失的类别中。
我在Ubuntu 14.04上从源码构建了TensorFlow,并启用了CUDA支持,诸如花朵的迁移学习示例运行得很好。然而,花朵的示例会移除最后一层并删除所有1000个现有类别,这意味着它现在可以识别5种花朵,但无法再识别熊猫等。例如:https://www.tensorflow.org/versions/r0.8/how_tos/image_retraining/index.html
我该如何将5个花朵类别添加到现有的1000个ImageNet类别中(并为这5个新花朵类别进行训练),这样我就可以拥有1005个类别来对测试图像进行分类?换句话说,能够同时识别熊猫和向日葵?
我知道一个选项是下载整个ImageNet训练集和花朵示例集,然后从头开始训练,但考虑到我当前的计算能力,这将需要很长时间,并且将来无法再添加例如100个更多的类别。
我有一个想法是,在用5个花朵类别重新训练时,将参数fine_tune
设置为false
,这样最后一层就不会被移除:https://github.com/tensorflow/models/blob/master/inception/README.md#how-to-retrain-a-trained-model-on-the-flowers-data,但我不确定如何继续,也不确定这是否会产生一个有效的具有1005个类别的模型。感谢您的意见。
回答:
遗憾的是,您无法向现有图中添加类别;您基本上需要保存一个检查点,并从该检查点开始训练该图。