视频中对象的分类(人类、动物、其他(汽车等))

大家好,我是图像处理领域的新手。我的项目是分类图像/视频中的对象。输入来自监控摄像头的图像/视频。我需要将对象分类为三类:1)人类 2)动物 3)其他(汽车)。我们可以考虑背景是固定的。

有谁能推荐一些经过验证的算法、论文或开源代码来实现这个目的吗?当然,谷歌搜索是显而易见的解决方案,但有经验的人的建议总是很有帮助的!


回答:

对于您的目的,我认为最好的选择是LatSVM,因为作者提供了MATLAB的实现和已经训练好的检测模型。已经训练好的模型包括:

  • 飞机、船、公交车、汽车、自行车
  • 瓶子、电视、沙发
  • 鸟、猫、马、羊、狗

如果您需要的话,OpenCV中也有实现(在这个问题中发现)。

其他检测器实现


请查看以下行人检测的调查报告:

  1. 行人检测:对现状的评估(2012年)。
  2. 高级驾驶辅助系统的行人检测调查(2010年)。

现状

  • 以每秒100帧的速度进行行人检测。由[Benenson 等人,2012年]提出的这项工作实现了高检测速度和最先进的精度[网页]。
  • 使用判别训练的部分模型进行对象检测,也称为LatSVM,在PASCAL 2006、2007和2008年取得了良好的结果。这项工作不仅展示了行人检测,还包括汽车、猫、马、沙发等。您真的应该看看这个[网页]。
  • 使用部分最小二乘分析进行人类检测。[Schwartz 等人,2009年]提出了使用部分最小二乘分析的方法,可以处理高维空间特征。

经典作品

以下作品在行人检测领域有重要贡献,是每项工作的参考。HOG特征、积分图像和拒绝级联被许多作品使用,包括[Benenson 等人,2012年]的作品。

  • 用于人类检测的方向梯度直方图
  • 使用方向梯度直方图级联进行快速人类检测

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注