视频中对象的分类(人类、动物、其他(汽车等))

大家好,我是图像处理领域的新手。我的项目是分类图像/视频中的对象。输入来自监控摄像头的图像/视频。我需要将对象分类为三类:1)人类 2)动物 3)其他(汽车)。我们可以考虑背景是固定的。

有谁能推荐一些经过验证的算法、论文或开源代码来实现这个目的吗?当然,谷歌搜索是显而易见的解决方案,但有经验的人的建议总是很有帮助的!


回答:

对于您的目的,我认为最好的选择是LatSVM,因为作者提供了MATLAB的实现和已经训练好的检测模型。已经训练好的模型包括:

  • 飞机、船、公交车、汽车、自行车
  • 瓶子、电视、沙发
  • 鸟、猫、马、羊、狗

如果您需要的话,OpenCV中也有实现(在这个问题中发现)。

其他检测器实现


请查看以下行人检测的调查报告:

  1. 行人检测:对现状的评估(2012年)。
  2. 高级驾驶辅助系统的行人检测调查(2010年)。

现状

  • 以每秒100帧的速度进行行人检测。由[Benenson 等人,2012年]提出的这项工作实现了高检测速度和最先进的精度[网页]。
  • 使用判别训练的部分模型进行对象检测,也称为LatSVM,在PASCAL 2006、2007和2008年取得了良好的结果。这项工作不仅展示了行人检测,还包括汽车、猫、马、沙发等。您真的应该看看这个[网页]。
  • 使用部分最小二乘分析进行人类检测。[Schwartz 等人,2009年]提出了使用部分最小二乘分析的方法,可以处理高维空间特征。

经典作品

以下作品在行人检测领域有重要贡献,是每项工作的参考。HOG特征、积分图像和拒绝级联被许多作品使用,包括[Benenson 等人,2012年]的作品。

  • 用于人类检测的方向梯度直方图
  • 使用方向梯度直方图级联进行快速人类检测

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注