Home IT技术视频中对象的分类（人类、动物、其他（汽车等））

视频中对象的分类（人类、动物、其他（汽车等））

IT技术 xiaolong · 2025年4月4日 · 0 Comment

大家好，我是图像处理领域的新手。我的项目是分类图像/视频中的对象。输入来自监控摄像头的图像/视频。我需要将对象分类为三类：1）人类 2）动物 3）其他（汽车）。我们可以考虑背景是固定的。

有谁能推荐一些经过验证的算法、论文或开源代码来实现这个目的吗？当然，谷歌搜索是显而易见的解决方案，但有经验的人的建议总是很有帮助的！

回答：

对于您的目的，我认为最好的选择是LatSVM，因为作者提供了MATLAB的实现和已经训练好的检测模型。已经训练好的模型包括：

飞机、船、公交车、汽车、自行车
瓶子、电视、沙发
鸟、猫、马、羊、狗
等

如果您需要的话，OpenCV中也有实现（在这个问题中发现）。

其他检测器实现

请查看以下行人检测的调查报告：

行人检测：对现状的评估（2012年）。
高级驾驶辅助系统的行人检测调查（2010年）。

现状

以每秒100帧的速度进行行人检测。由[Benenson 等人，2012年]提出的这项工作实现了高检测速度和最先进的精度[网页]。
使用判别训练的部分模型进行对象检测，也称为LatSVM，在PASCAL 2006、2007和2008年取得了良好的结果。这项工作不仅展示了行人检测，还包括汽车、猫、马、沙发等。您真的应该看看这个[网页]。
使用部分最小二乘分析进行人类检测。[Schwartz 等人，2009年]提出了使用部分最小二乘分析的方法，可以处理高维空间特征。

经典作品

以下作品在行人检测领域有重要贡献，是每项工作的参考。HOG特征、积分图像和拒绝级联被许多作品使用，包括[Benenson 等人，2012年]的作品。

用于人类检测的方向梯度直方图
使用方向梯度直方图级联进行快速人类检测

artificial-intelligence computer-vision image-processing machine-learning object-detection

发表回复取消回复