在阅读和搜索有关预训练网络的微调的信息时,我了解到它通常分为以下两个步骤(简而言之):
- 冻结隐藏层,解冻全连接层并进行训练。
- 解冻两个层并再次进行训练。
我的问题是:
-
仅执行第一步是否足够?
-
如果我只执行第一步,这是否与网络作为特征提取器的方法相同?
(网络作为特征提取器的方法是,使用预训练网络提取特征,并使用传统的机器学习分类算法进行分类)。
如果您需要更多信息来澄清问题,请告诉我。
回答:
你的问题有一些问题…
首先,你明显暗示了一个只有两层的网络,这与当前实践中实际使用的微调方式相差甚远(非常远)。
其次,你在第一个问题中提到的“足够”到底是什么意思(足够做什么)?