我读了一些关于迁移学习的论文和博客文章。我发现有些文章说“不同”,而另一些则说“不同但相似”。现在,我感到很困惑。
假设,
D
是领域。 T
是任务。a
是源,因此源领域是 Da
且源任务是 Ta
。a'
与 a
不同但相似。b
与 a
不同。Ms
是从 Da
和 Ta
中学习到的源模型。Mt
是目标模型。
在哪个目标领域-任务组合中,Ms
可以将其知识转移到 Mt
?
1. (Da, Tb)2. (Db, Ta)3. (Da', Tb)4. (Db, Ta')5. (Da', Ta)6. (Da, Ta')7. (Da', Ta')8. (Db, Tb)
坦白说,我知道 5、6、7 是可能的,因为论文中是这么说的。我怀疑 8 会有效(不会吧?)。
但是,1、2、3、4 中,领域或任务是 b
的情况又如何呢?
回答:
什么是“领域”?
在自然语言处理(NLP)领域,有很多关于领域适应的研究,你可以从你描述的所有情况(#1-#8)中获益,这些情况在NLP中被称为“不同领域” – 例如新闻文本与推文文本与临床放射报告文本;是的,甚至在#8中也是如此。
然而,你也可以有更加不同的“领域”(在我看来,这实际上不应该被称为领域) – 例如,英语文本与中文文本;或英语文本与英语音频录音。即使在这些情况下,也可以进行一些迁移学习,但非常有限;所以这真的取决于你如何划分“这是不同的领域”与“这是完全不同类型的数据输入”。