我正在尝试使用从sklearn.datasets.fetch_lfw_people
获取的数据来训练一个简单的HOG人脸检测器。获取数据集后,我发现了以下键:
In [1]: lfw_people.keys()Out[1]: ['images', 'data', 'target_names', 'DESCR', 'target']
images
包含裁剪后的人脸target_names
包含人类可读的名字target
包含图像中人物的数字ID号DESCR
标识记录属于LFW数据集。
… 但data
到底是什么?
在我这里,它是一个(13233 x 1850)
的浮点数numpy数组,也就是说每张图像对应一行1850个浮点数。
这个data
字段的性质是什么?
回答:
(lfw_people.images[0].ravel() == lfw_people.data[0]).all()
的计算结果为True
,因此看来data
字段只是将图像展平为一个向量。
谜团解开了,但这种事情真的应该提前说明 :/