图像中的标志识别

有谁知道最近在图像中进行标志识别的学术研究吗?请仅在你熟悉这个特定主题时回答(我自己可以用Google搜索“标志识别”,非常感谢)。任何在计算机视觉领域有知识并从事过对象识别工作的人也欢迎评论。

更新:请参考算法方面(你认为合适的方法,领域内的论文,是否应该(并且已经测试过)适用于现实世界数据,效率考虑)而不是技术方面(使用的编程语言或是否使用OpenCV…)。图像索引和基于内容的图像检索方面的工作也可能有帮助。


回答:

你可以在这里尝试使用像SIFT这样的局部特征:http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

它应该有效,因为标志的形状通常是恒定的,因此提取的特征应该能很好地匹配。

工作流程将如下所示:

  1. 检测角点(例如Harris角点检测器) – 对于耐克标志,它们是两个尖端。

  2. 计算描述符(如SIFT – 128D整数向量)

  3. 在训练阶段记住它们;在匹配阶段,为训练期间获得的数据库中的每个特征查找最近的邻居。最后,你会得到一组匹配(其中一些可能是错误的)。

  4. 使用RANSAC筛选出错误的匹配。这样你将得到一个矩阵,该矩阵描述了从理想标志图像到你找到标志的图像的变换。根据设置,你可以允许不同类型的变换(仅平移;平移和旋转;仿射变换)。

Szeliski的书有一章(4.1)关于局部特征。http://research.microsoft.com/en-us/um/people/szeliski/Book/

附注:

  1. 我假设你想在照片中找到标志,例如找到所有百事可乐广告牌,因此它们可能会变形。如果你需要在屏幕上找到电视台标志(因此它没有旋转和缩放),你可以更容易地做到(模式匹配或其他方法)。

  2. 传统的SIFT不考虑颜色信息。由于标志通常具有恒定的颜色(尽管确切的颜色取决于光照和相机),你可能想要以某种方式考虑颜色信息。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注