如何用Python找到沃利?

毫不羞愧地跳上这个潮流 🙂

受到如何用Mathematica找到沃利和后续的如何用R找到沃利的启发,作为一个新的Python用户,我很想看看这是如何实现的。看起来Python比R更适合这个任务,而且我们不必像使用Mathematica或Matlab那样担心许可证问题。

在像下面的例子中,显然仅仅使用条纹是行不通的。如果能为这种困难的例子制定一个简单的基于规则的方法将会很有趣。

在海滩上

我添加了[machine-learning]标签,因为我相信正确的答案将不得不使用机器学习技术,比如Gregory Klopper在原始线程中提倡的受限玻尔兹曼机(RBM)方法。有一些在Python中可用的RBM代码,这可能是一个好的起点,但显然需要训练数据来使用这种方法。

2009 IEEE国际机器学习用于信号处理研讨会(MLSP 2009)上,他们举办了一个数据分析竞赛:沃利在哪里?。训练数据以Matlab格式提供。请注意,该网站上的链接已失效,但数据(以及Sean McLoone及其同事采用的方法的来源)可以在这里找到(参见SCM链接)。这似乎是一个开始的地方。


回答:

这里有一个使用mahotas的实现

from pylab import imshowimport numpy as npimport mahotaswally = mahotas.imread('DepartmentStore.jpg')wfloat = wally.astype(float)r,g,b = wfloat.transpose((2,0,1))

分成红色、绿色和蓝色通道。为了下面的浮点运算,最好在顶部进行转换。

w = wfloat.mean(2)

w是白色通道。

pattern = np.ones((24,16), float)for i in xrange(2):    pattern[i::4] = -1

构建一个在垂直轴上+1,+1,-1,-1的模式。这是沃利的衬衫。

v = mahotas.convolve(r-w, pattern)

用红色减去白色进行卷积。这将在衬衫所在的地方产生强烈的响应。

mask = (v == v.max())mask = mahotas.dilate(mask, np.ones((48,24)))

寻找最大值并进行膨胀以使其可见。现在,我们降低整个图像的亮度,除了感兴趣的区域:

wally -= .8*wally * ~mask[:,:,None]imshow(wally)

然后我们得到了沃利

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注