我正在尝试制作一个sklearn图像分类器,但无法将数据拟合到分类器中。
x_train = np.array(im_matrix)y_train = [0, 0, 0, 0, 0, 1, 1, 1, 1, 1]clf = GaussianNB()clf.fit(x_train, y_train)
在clf.fit(x_train, y_train)
处,我得到了以下错误:
ValueError: setting an array element with a sequence.
im_matrix是一个保存图像矩阵的数组:
for file in files: path = os.path.join(root, file) im_matrix.append(mpimg.imread(path))
x_train的形状是(10, 1),y_train的形状是(10,)
我猜测问题出在x_train的形状不太正常:
array([array([[[227, 255, 233], [227, 255, 233], [227, 255, 233], ..., [175, 140, 160], [175, 140, 160], [175, 140, 160]], [[227, 255, 233], [227, 255, 233], [227, 255, 233], ..., [174, 139, 159], [174, 139, 159], [174, 139, 159]], [[227, 255, 233], [227, 255, 233], [227, 255, 233], ..., [173, 138, 158], [173, 138, 158], [173, 138, 158]], ..., [[199, 222, 253], [121, 142, 169], [ 13, 34, 55], ..., [ 31, 40, 49], [ 31, 40, 49], [ 32, 41, 50]], [[187, 206, 246], [ 80, 98, 134], [ 0, 13, 41], ..., [ 36, 44, 63], [ 35, 43, 62], [ 35, 43, 62]], [[187, 206, 246], [ 80, 98, 134], [ 0, 13, 41], ..., [ 36, 44, 63], [ 35, 43, 62], [ 35, 43, 62]]], dtype=uint8),
这个问题已经在这里被问过几次了,但我找不到解决方案。任何帮助都将不胜感激
回答:
大多数(如果不是全部的话)scikit-learn函数期望输入X
,这是一个形状为(n_samples, n_features)
的2D数组
。
根据X, y拟合高斯朴素贝叶斯
参数:X : array-like, 形状 (n_samples, n_features)
训练向量,其中n_samples是样本数量,n_features是特征数量。
为了解决您的问题,请使用图像的向量表示,然后将每个向量作为x_train
矩阵中的一行。
最后,使用这个X来拟合GaussianNB
。
如何将图像向量化?
可以使用如下方法:
import numpy as npfrom PIL import Imageimg = Image.open('orig.png').convert('RGBA')arr = np.array(img)# 将arr变成一维视图flat_arr = arr.ravel()