毫不羞愧地跳上这个潮流 🙂
受到如何用Mathematica找到沃利和后续的如何用R找到沃利的启发,作为一个新的Python用户,我很想看看这是如何实现的。看起来Python比R更适合这个任务,而且我们不必像使用Mathematica或Matlab那样担心许可证问题。
在像下面的例子中,显然仅仅使用条纹是行不通的。如果能为这种困难的例子制定一个简单的基于规则的方法将会很有趣。
我添加了[machine-learning]标签,因为我相信正确的答案将不得不使用机器学习技术,比如Gregory Klopper在原始线程中提倡的受限玻尔兹曼机(RBM)方法。有一些在Python中可用的RBM代码,这可能是一个好的起点,但显然需要训练数据来使用这种方法。
在2009 IEEE国际机器学习用于信号处理研讨会(MLSP 2009)上,他们举办了一个数据分析竞赛:沃利在哪里?。训练数据以Matlab格式提供。请注意,该网站上的链接已失效,但数据(以及Sean McLoone及其同事采用的方法的来源)可以在这里找到(参见SCM链接)。这似乎是一个开始的地方。
回答:
这里有一个使用mahotas的实现
from pylab import imshowimport numpy as npimport mahotaswally = mahotas.imread('DepartmentStore.jpg')wfloat = wally.astype(float)r,g,b = wfloat.transpose((2,0,1))
分成红色、绿色和蓝色通道。为了下面的浮点运算,最好在顶部进行转换。
w = wfloat.mean(2)
w
是白色通道。
pattern = np.ones((24,16), float)for i in xrange(2): pattern[i::4] = -1
构建一个在垂直轴上+1,+1,-1,-1的模式。这是沃利的衬衫。
v = mahotas.convolve(r-w, pattern)
用红色减去白色进行卷积。这将在衬衫所在的地方产生强烈的响应。
mask = (v == v.max())mask = mahotas.dilate(mask, np.ones((48,24)))
寻找最大值并进行膨胀以使其可见。现在,我们降低整个图像的亮度,除了感兴趣的区域:
wally -= .8*wally * ~mask[:,:,None]imshow(wally)
然后我们得到了!