我在尝试使用 Keras 构建一个神经网络,该网络首先检查输入是猫还是狗(基础模型)。
如果是狗,则将其传递给另一个模型(子模型1)。
如果是猫,则将其传递给另一个模型(子模型2)。
子模型是专门训练用于根据品种进行分类的较小模型,因此子模型1将狗分类成各种狗的品种,而子模型2将猫分类成各种猫的品种。
我面临的问题是:我不知道如何添加条件层,使得如果基础模型有500万个神经元,每个子模型有200万个神经元,当一张图片通过基础模型后,它应该只通过子模型1或子模型2,这样总共只有700万个神经元在处理一张图片到最终输出的过程中起作用。
任何帮助、参考都将不胜感激。
回答:
这里有另一个解决方案,它可能会训练得更快,运行得更快,使用更少的RAM,提供更好的性能,并且比这里列出的其他方案更易于使用。
只需使用一个具有多个输出的单一模型:一个二元输出(猫/狗),一个猫品种输出(多类别)和一个狗品种输出(多类别)。在训练过程中,您可以使用自定义损失函数来忽略与错误物种对应的损失(例如,对于狗图片忽略猫品种输出)。
这样做的好处包括:
- 训练更快:只需训练一个模型。
- 性能更好:在进行这种多任务学习时,通常可以获得更好的性能。这是因为狗图片和猫图片有很多共同点,因此训练一个用于两者的单一基础神经网络,然后在此基础上构建专业化的网络是有帮助的。
- 更少的RAM和计算量:我们不需要通过两个CNN(一个用于猫/狗检测器,一个用于品种分类),只需通过一个(基础网络)。这在很大程度上抵消了我们即使在猫/狗检测器表示是猫时也通过狗品种分类器进行的不必要计算。
- 更易于使用:只需调用一次模型,您就可以一次获得所有需要的信息。此外,如果猫/狗检测器不太确定(例如,它输出50%的概率),那么至少您可以为猫和狗都得到合理的候选者。
这是一个工作示例。您只需用自己的数据替换即可。请注意,这里有三个标签:
- 猫/狗:例如[0, 1, 1, 0]代表狗、猫、猫、狗
- 猫品种:例如[-1, 2, 0, -1]代表非猫、第二类猫、零类猫、非猫
- 狗品种:例如[3, -1, -1, 1]代表第三类狗、非狗、非狗、第一类狗