有谁知道最近在图像中进行标志识别的学术研究吗?请仅在你熟悉这个特定主题时回答(我自己可以用Google搜索“标志识别”,非常感谢)。任何在计算机视觉领域有知识并从事过对象识别工作的人也欢迎评论。
更新:请参考算法方面(你认为合适的方法,领域内的论文,是否应该(并且已经测试过)适用于现实世界数据,效率考虑)而不是技术方面(使用的编程语言或是否使用OpenCV…)。图像索引和基于内容的图像检索方面的工作也可能有帮助。
回答:
你可以在这里尝试使用像SIFT这样的局部特征:http://en.wikipedia.org/wiki/Scale-invariant_feature_transform
它应该有效,因为标志的形状通常是恒定的,因此提取的特征应该能很好地匹配。
工作流程将如下所示:
-
检测角点(例如Harris角点检测器) – 对于耐克标志,它们是两个尖端。
-
计算描述符(如SIFT – 128D整数向量)
-
在训练阶段记住它们;在匹配阶段,为训练期间获得的数据库中的每个特征查找最近的邻居。最后,你会得到一组匹配(其中一些可能是错误的)。
-
使用RANSAC筛选出错误的匹配。这样你将得到一个矩阵,该矩阵描述了从理想标志图像到你找到标志的图像的变换。根据设置,你可以允许不同类型的变换(仅平移;平移和旋转;仿射变换)。
Szeliski的书有一章(4.1)关于局部特征。http://research.microsoft.com/en-us/um/people/szeliski/Book/
附注:
-
我假设你想在照片中找到标志,例如找到所有百事可乐广告牌,因此它们可能会变形。如果你需要在屏幕上找到电视台标志(因此它没有旋转和缩放),你可以更容易地做到(模式匹配或其他方法)。
-
传统的SIFT不考虑颜色信息。由于标志通常具有恒定的颜色(尽管确切的颜色取决于光照和相机),你可能想要以某种方式考虑颜色信息。