如何进行多头学习

我有大约5个模型，单独训练时效果还不错，但我想将它们融合成一个大的模型。我之所以考虑这样做，是因为在大规模生产环境中，一个大的模型比多个小的模型更容易更新。这是我想实现的效果的图片。

我的问题是，这样做可以吗？每个头模型有一个数据集，我应该如何训练整个模型？

回答：

我的问题是，这样做可以吗？

当然可以。这种方法被称为多任务学习。根据你的数据集和你想要实现的目标，这甚至可能会提高性能。微软使用了一个多任务模型在NLP Glue基准测试中取得了不错的成果，但他们也指出，通过针对每个单独任务微调联合模型，可以进一步提高性能。

每个头模型有一个数据集，我应该如何训练整个模型？

你只需要pytorch的ModuleList：

#请注意这只是伪代码，我对计算机视觉不太熟悉#
#因此你需要检查resnet50的导入是否正确，并查找任务特定内容的导入
from torch import nn
from torchvision.models import resnet50
class MultiTaskModel(nn.Module):
    def __init__(self):
        #共享部分
        self.resnet50 = resnet50()
        #任务特定部分
        self.tasks = nn.ModuleList()
        self.tasks.add_module('depth', Depth())
        self.tasks.add_module('denseflow', Denseflow())
        #...
    def forward(self, tasktag, ...):
        #共享部分
        resnet_output = self.resnet50(...)
        #任务特定部分
        if tasktag == 'depth':
            return self.tasks.depth(resnet_output)
        elif tasktag == 'denseflow':
            return self.tasks.denseflow(resnet_output)
        #...

学技术

如何进行多头学习

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复