绘画和绘画机器人的算法 – 有什么建议吗?

绘画和绘画机器人的算法 –

大家好!

我想编写一个软件,它可以分析图像,然后生成一个图像,该图像能够捕捉人眼在原始图像中感知到的内容,使用最少数量的具有不同颜色和不透明度的贝塞尔路径对象。

与最近的 Twitter 超级压缩竞赛参见:stackoverflow.com/questions/891643/twitter-image-encoding-challenge不同,我的目标不是创建一个忠实于原始图像的复制品,而是重现人类观看图像的体验。

举例来说,如果原始图像的左上角显示一个红色气球,而复制品在左上角也有一个看起来像红色气球的东西,那么我就达到了我的目标,即使复制品中的气球不在完全相同的位置,也不是完全相同的大小或颜色。

当我说“人所感知到的”时,我的意思是将其限制在一个非常有限的范围内。我不是试图分析图像的含义,我不需要知道图像的内容是什么,我只对人眼会注意到的关键视觉特征感兴趣,前提是这可以通过一个算法来自动化,这个算法没有能力概念化它实际观察到的东西。

为什么选择这种以人类感知为标准而不是摄影准确性的不同寻常的标准呢?

这个软件将被用于驱动一个绘画和绘画机器人,它将与一位人类艺术家合作参见:video.google.com/videosearch?q=mr%20squiggle

算法不应将人类所做的、不完全符合摄影效果的标记视为必然的错误,而应设法将画布上已有的内容纳入最终图像中。

因此,相对亮度、色调、饱和度、大小和位置比与原始照片完全相同更重要。 保持特征的拓扑结构、色块、渐变、凸曲线和凹曲线比这些特征的确切大小、形状和颜色更重要。

还能跟上吗?

我的问题是,我有点患上了“当你有一把锤子时,一切看起来都像钉子”的综合症。 在我看来,解决这个问题的方法是使用遗传算法,并使用类似 wavelet transform 的比较(参见: grail.cs.washington.edu/projects/query/),该方法被 retrievr (参见: labs.systemone.at/retrievr/) 用于选择合适的解决方案。

但我认为这是答案的主要原因是,这些是我所知道的技术,可能存在使用我一无所知的技术的更优雅的解决方案。

考虑到人类视觉系统分析图像的方式尤其有趣,因此可能需要特别注意直线和角度、高对比度边界和大型相似颜色块。

您是否有任何关于视觉、图像算法、遗传算法或类似项目,我应该阅读的建议?

谢谢。

Mat

PS. 上面的一些拼写对您和您的拼写检查器来说可能是错误的。 这只是国际拼写变体,可能与您所在国家的标准不同:例如澳大利亚标准:colour 与美国标准:color


回答:

有一个模型可以作为一种算法来实现,以计算图像的显着性图,确定图像的哪些部分会得到人类最多的关注。

该模型被称为 Itti-Koch 模型。
您可以在这里找到一篇入门论文。
这里可以找到更多资源和 c++ 源代码。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注