计算图片及其草图的相似度

我正在尝试开发一种算法,该算法可以为给定的两张黑白图像返回相似度分数:一张是原图,另一张是人手绘的草图:

enter image description here

所有原图都具有相同的风格,但没有给定任何有限的集合。它们的内容可能完全不同。

我尝试了几种方法,但到目前为止都没有成功:

OpenCV模板匹配

OpenCV的matchTemplate无法计算图像的相似度分数。它只能告诉我匹配像素的数量,而这个值通常相当低,因为人手绘的草图比例不理想。

OpenCV特征匹配

我尝试这种方法失败了,因为我无法找到从人手绘的草图中提取重要特征的好算法。来自OpenCV教程的算法在提取角点和斑点作为特征方面表现良好。但是在草图中,我们有很多笔触——每一个都产生了很多不重要的、无关紧要的特征,导致结果模糊不清。

神经网络分类

我还研究了神经网络——它们在图像分类方面表现出色,但它们也需要为每个类别准备训练集,而这一部分是不可能的,因为我们有无限的可能图像集。

您会使用哪些方法和算法来完成这种任务?


回答:

方法1

余弦相似度给出了一个在0到1之间的相似度分数。

我首先将图像转换为灰度并对其进行二值化。我将原图裁剪到一半大小并排除了文本,如下所示:

enter image description here

enter image description here

然后我将图像数组转换为1D数组,使用flatten()。我使用以下代码计算余弦相似度

from scipy import spatialresult = spatial.distance.cosine(im2, im1)print result

我得到的结果是0.999999988431,这意味着图像之间的相似度达到了这个分数。

编辑

方法2

我有时间检查了另一种解决方案。我发现OpenCV的cv2.matchTemplate()函数执行相同的任务。

如果你查看这个文档页面,你会看到使用的不同参数。

我使用了cv2.TM_SQDIFF_NORMED参数(它给出两张图像之间的归一化平方差)。

    res = cv2.matchTemplate(th1, th2, cv2.TM_SQDIFF_NORMED)    print 1 - res

对于给定的图像,我得到了一个相似度分数:0.89689457

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注