大家好,我是图像处理领域的新手。我的项目是分类图像/视频中的对象。输入来自监控摄像头的图像/视频。我需要将对象分类为三类:1)人类 2)动物 3)其他(汽车)。我们可以考虑背景是固定的。
有谁能推荐一些经过验证的算法、论文或开源代码来实现这个目的吗?当然,谷歌搜索是显而易见的解决方案,但有经验的人的建议总是很有帮助的!
回答:
对于您的目的,我认为最好的选择是LatSVM,因为作者提供了MATLAB的实现和已经训练好的检测模型。已经训练好的模型包括:
- 飞机、船、公交车、汽车、自行车
- 瓶子、电视、沙发
- 鸟、猫、马、羊、狗
- 等
如果您需要的话,OpenCV中也有实现(在这个问题中发现)。
其他检测器实现
请查看以下行人检测的调查报告:
- 行人检测:对现状的评估(2012年)。
- 高级驾驶辅助系统的行人检测调查(2010年)。
现状
- 以每秒100帧的速度进行行人检测。由[Benenson 等人,2012年]提出的这项工作实现了高检测速度和最先进的精度[网页]。
- 使用判别训练的部分模型进行对象检测,也称为LatSVM,在PASCAL 2006、2007和2008年取得了良好的结果。这项工作不仅展示了行人检测,还包括汽车、猫、马、沙发等。您真的应该看看这个[网页]。
- 使用部分最小二乘分析进行人类检测。[Schwartz 等人,2009年]提出了使用部分最小二乘分析的方法,可以处理高维空间特征。
经典作品
以下作品在行人检测领域有重要贡献,是每项工作的参考。HOG特征、积分图像和拒绝级联被许多作品使用,包括[Benenson 等人,2012年]的作品。
- 用于人类检测的方向梯度直方图
- 使用方向梯度直方图级联进行快速人类检测