假设你得到了这样一张图片
并且你被要求编程实现仅对其内部进行适当的着色,但程序不仅要适用于这个形状和其他基本图形,还要适用于任何轮廓形状,无论其复杂程度如何,是否有阴影。
这就是我试图解决的问题,但我在此处遇到了困难,似乎教计算机识别黑色线条并在其内部着色应该很简单。但搜索结果大多是关于特征脸风格的识别算法,这对我来说似乎是过度拟合,并且对于至少这个问题的基本形式来说,复杂度远高于所需。
我想将这个问题框定为一个监督学习分类问题,其目的是将完整的图像输入我的模型,模型将输出由分类为object
或background
的像素组成的较小的numpy
数组。但为了做到这一点,我需要提供训练数据,这对我来说似乎需要手动标记训练集中每个像素,这显然违背了程序的目的。
现在你了解了背景,我的疑问是,给定这张图片,是否有有效的方法获得两个不同的数组,每个数组由所有不包含任何纯黑色(RGB(0,0,0))像素的相邻像素组成?
这样可以使一组像素位于圆形内部,另一组像素位于圆形外部
回答:
你可以使用scipy.ndimage.measurements.label
来完成大部分工作:
import scipy.ndimageimport scipy.miscdata = scipy.misc.imread(...)assert data.ndim == 2, "Image must be monochromatic"# finds and number all disjoint white regions of the imageis_white = data > 128labels, n = scipy.ndimage.measurements.label(is_white)# get a set of all the region ids which are on the edge - we should not fill theseon_border = set(labels[:,0]) | set(labels[:,-1]) | set(labels[0,:]) | set(labels[-1,:])for label in range(1, n+1): # label 0 is all the black pixels if label not in on_border: # turn every pixel with that label to black data[labels == label] = 0
这将填充图像中所有封闭的形状,考虑到被图像边缘切割的形状不被视为封闭