多个 问题 都涉及到SIFT算法,但它们似乎都集中在两个图像之间的简单比较上。与其确定两幅图像的相似度,不如使用SIFT从成千上万的图像集合中找出最匹配的图像是否可行?换句话说,SIFT是否具有可扩展性?
例如,使用SIFT为一批图像生成关键点,将这些关键点存储在数据库中,然后找出与“查询”图像生成的关键点欧几里得距离最短的那些是否可行?
在计算欧几里得距离时,是否忽略关键点的x、y、尺度和方向部分,仅查看描述符?
回答:
有几种方法可以解决这个问题。
一种流行的方法是所谓的词袋表示法,它仅基于匹配的描述符数量进行匹配,从而忽略了由(x, y, 尺度和方向)组成的位置部分,仅查看描述符。
对大型数据库进行高效查询可能使用近似方法,如局部敏感哈希
其他方法可能涉及词汇树或其他数据结构。
要使用一种同时考虑位置信息的高效方法,请查看金字塔匹配核