我正在尝试开发一种算法,该算法可以为给定的两张黑白图像返回相似度分数:一张是原图,另一张是人手绘的草图:
所有原图都具有相同的风格,但没有给定任何有限的集合。它们的内容可能完全不同。
我尝试了几种方法,但到目前为止都没有成功:
OpenCV模板匹配
OpenCV的matchTemplate无法计算图像的相似度分数。它只能告诉我匹配像素的数量,而这个值通常相当低,因为人手绘的草图比例不理想。
OpenCV特征匹配
我尝试这种方法失败了,因为我无法找到从人手绘的草图中提取重要特征的好算法。来自OpenCV教程的算法在提取角点和斑点作为特征方面表现良好。但是在草图中,我们有很多笔触——每一个都产生了很多不重要的、无关紧要的特征,导致结果模糊不清。
神经网络分类
我还研究了神经网络——它们在图像分类方面表现出色,但它们也需要为每个类别准备训练集,而这一部分是不可能的,因为我们有无限的可能图像集。
您会使用哪些方法和算法来完成这种任务?
回答:
方法1
余弦相似度给出了一个在0到1之间的相似度分数。
我首先将图像转换为灰度并对其进行二值化。我将原图裁剪到一半大小并排除了文本,如下所示:
然后我将图像数组转换为1D数组,使用flatten()
。我使用以下代码计算余弦相似度:
from scipy import spatialresult = spatial.distance.cosine(im2, im1)print result
我得到的结果是0.999999988431,这意味着图像之间的相似度达到了这个分数。
编辑
方法2
我有时间检查了另一种解决方案。我发现OpenCV的cv2.matchTemplate()
函数执行相同的任务。
如果你查看这个文档页面,你会看到使用的不同参数。
我使用了cv2.TM_SQDIFF_NORMED
参数(它给出两张图像之间的归一化平方差)。
res = cv2.matchTemplate(th1, th2, cv2.TM_SQDIFF_NORMED) print 1 - res
对于给定的图像,我得到了一个相似度分数:0.89689457