我读过关于数据集不平衡如何严重影响分类结果的文章,但使用迁移学习方法(如SSD)进行目标检测,是否意味着我们不需要平衡数据集就能获得好的结果?
回答:
简短答案:不。但实际上,可能可以。
这两个概念是无关的。迁移学习的目标是在你没有训练数据或者无法/不愿从头开始学习时提供帮助。
真正的答案取决于许多因素:你的数据集有多不平衡(一点还是很多?),你使用的算法类型(是生成型的如贝叶斯,还是判别型的如SVM?),类别有多“可分”?可能还有更多其他因素。
使用贝叶斯分类器时,你通常可以调整类别的先验概率…
所以答案肯定会因你处理的问题而异…这个问题没有一个普遍的答案。