图像中的标志识别

有谁知道最近在图像中进行标志识别的学术研究吗?请仅在你熟悉这个特定主题时回答(我自己可以用Google搜索“标志识别”,非常感谢)。任何在计算机视觉领域有知识并从事过对象识别工作的人也欢迎评论。

更新:请参考算法方面(你认为合适的方法,领域内的论文,是否应该(并且已经测试过)适用于现实世界数据,效率考虑)而不是技术方面(使用的编程语言或是否使用OpenCV…)。图像索引和基于内容的图像检索方面的工作也可能有帮助。


回答:

你可以在这里尝试使用像SIFT这样的局部特征:http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

它应该有效,因为标志的形状通常是恒定的,因此提取的特征应该能很好地匹配。

工作流程将如下所示:

  1. 检测角点(例如Harris角点检测器) – 对于耐克标志,它们是两个尖端。

  2. 计算描述符(如SIFT – 128D整数向量)

  3. 在训练阶段记住它们;在匹配阶段,为训练期间获得的数据库中的每个特征查找最近的邻居。最后,你会得到一组匹配(其中一些可能是错误的)。

  4. 使用RANSAC筛选出错误的匹配。这样你将得到一个矩阵,该矩阵描述了从理想标志图像到你找到标志的图像的变换。根据设置,你可以允许不同类型的变换(仅平移;平移和旋转;仿射变换)。

Szeliski的书有一章(4.1)关于局部特征。http://research.microsoft.com/en-us/um/people/szeliski/Book/

附注:

  1. 我假设你想在照片中找到标志,例如找到所有百事可乐广告牌,因此它们可能会变形。如果你需要在屏幕上找到电视台标志(因此它没有旋转和缩放),你可以更容易地做到(模式匹配或其他方法)。

  2. 传统的SIFT不考虑颜色信息。由于标志通常具有恒定的颜色(尽管确切的颜色取决于光照和相机),你可能想要以某种方式考虑颜色信息。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注