深度学习中的多头模型是什么?
到目前为止,我找到的唯一解释是这样的:每个模型都可以被认为是一个主干加上一个头,如果你预训练主干并加上一个随机头,你可以对其进行微调,这是一个好主意
请有人提供更详细的解释。
回答:
你找到的解释是准确的。根据你想要在数据上预测的内容,你需要一个合适的主干网络和一定数量的预测头。
例如,对于一个基本的分类网络,你可以将ResNet、AlexNet、VGGNet、Inception等视为主干,而全连接层则作为唯一的预测头。
一个需要多头的典型问题是定位问题,你不仅想要对图像中的内容进行分类,还想对物体进行定位(找出其边界框的坐标)。
主干网络(“卷积和池化”)负责从图像中提取一个包含高级总结信息的特征图。每个头使用这个特征图作为输入来预测其所需的结果。
在训练过程中,你优化的损失通常是每个预测头的个别损失的加权和。