我想构建一个能够生成网络的人脸检测器/分类器,以检测图像/视频中是否存在人脸。
我理解基本概念,但我遇到的问题是类别的数量选择。最初,我认为两个类别(有脸/无脸)就足够了。然而,我不确定应该使用哪些数据来表示“无脸”类别。于是我收集了设备、植物和动物的数据集,结果类别非常不平衡,这显然不好。接着我又想,最好是尽可能多地使用类别。
但我再次感到困惑,不知道解决这个问题的最佳/常见方法是什么?
回答:
您可以尝试使用不同数量的样本和不同的图像来构建负类。如果您拥有的设备/植物/地点数据集不平衡,您可以尝试子抽样,例如从每个类别中选取100张图像。
只是不要让负类相对于您拥有的含人样本的图像数量变得过于庞大。其余的就靠实验了。