我在研究Viola-Jones论文,以便更好地理解他们的对象检测算法并开发一个可应用的程序。在特征主题的最后一段,作者提到检测器的基础分辨率为24×24,他们说矩形特征的详尽集合非常大,超过180,000个。请注意,与Haar基不同,矩形特征集合是超完备的。这是否意味着每一个矩形特征都是24×24的,还是仅仅意味着我们将给定的图像分成24×24的块?180,000是针对每个24×24块寻找几种Haar-like特征的结果吗?我也无法理解最后部分提到的矩形特征集合是超完备的。谈到矩形特征时,超完备意味着什么?谢谢。
回答:
如同一段中所述,每个24×24的矩形特征只给你一个数字,“两个矩形特征的值是两个矩形区域内像素和的差异”,“三个矩形特征计算两个外部矩形内的和减去中心矩形内的和。最后,四个矩形特征计算对角线成对矩形之间的差异。”
关于180,000这个数字的解释可以在以下链接找到:Viola-Jones人脸检测声称有180k特征
超完备集合意味着你有一些特征是其他特征的线性组合。在24×24矩形特征的情况下,我们可以通过取所有在其一个方块中值为1而其他所有方块中值为0的矩形来构建这个空间的线性基。如果我们计算这种配置有多少种选项,我们得到24*24=576,这远小于180,000。这意味着从他们的180,000个集合中,我们有一些矩形可以作为我们集合中其他矩形的组合获得。