如何用Python找到沃利?

毫不羞愧地跳上这个潮流 🙂

受到如何用Mathematica找到沃利和后续的如何用R找到沃利的启发,作为一个新的Python用户,我很想看看这是如何实现的。看起来Python比R更适合这个任务,而且我们不必像使用Mathematica或Matlab那样担心许可证问题。

在像下面的例子中,显然仅仅使用条纹是行不通的。如果能为这种困难的例子制定一个简单的基于规则的方法将会很有趣。

在海滩上

我添加了[machine-learning]标签,因为我相信正确的答案将不得不使用机器学习技术,比如Gregory Klopper在原始线程中提倡的受限玻尔兹曼机(RBM)方法。有一些在Python中可用的RBM代码,这可能是一个好的起点,但显然需要训练数据来使用这种方法。

2009 IEEE国际机器学习用于信号处理研讨会(MLSP 2009)上,他们举办了一个数据分析竞赛:沃利在哪里?。训练数据以Matlab格式提供。请注意,该网站上的链接已失效,但数据(以及Sean McLoone及其同事采用的方法的来源)可以在这里找到(参见SCM链接)。这似乎是一个开始的地方。


回答:

这里有一个使用mahotas的实现

from pylab import imshowimport numpy as npimport mahotaswally = mahotas.imread('DepartmentStore.jpg')wfloat = wally.astype(float)r,g,b = wfloat.transpose((2,0,1))

分成红色、绿色和蓝色通道。为了下面的浮点运算,最好在顶部进行转换。

w = wfloat.mean(2)

w是白色通道。

pattern = np.ones((24,16), float)for i in xrange(2):    pattern[i::4] = -1

构建一个在垂直轴上+1,+1,-1,-1的模式。这是沃利的衬衫。

v = mahotas.convolve(r-w, pattern)

用红色减去白色进行卷积。这将在衬衫所在的地方产生强烈的响应。

mask = (v == v.max())mask = mahotas.dilate(mask, np.ones((48,24)))

寻找最大值并进行膨胀以使其可见。现在,我们降低整个图像的亮度,除了感兴趣的区域:

wally -= .8*wally * ~mask[:,:,None]imshow(wally)

然后我们得到了沃利

Related Posts

交叉熵和对数损失误差之间的区别是什么?

交叉熵和对数损失误差之间的区别是什么?它们的公式看起来…

Keras损失持续低但准确率开始高后下降

首先,我的假设可能有误: 损失是每个训练样本与正确答案…

在TensorFlow中实现简单的Softmax分类器

我正在尝试用TensorFlow编写一个简单的Soft…

如何对没有等级/顺序的分类变量进行编码?

我主要处理的分类问题涉及数值特征,如大小、身高、体重、…

错误:需要参数 -s/–source

我从Github上复制了这段代码,但对我来说它不起作用…

sklearn: 使用交叉验证的递归特征消除有什么好处?

当我查看使用交叉验证的递归特征消除时,我在想sklea…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注