高效分割numpy数组

假设有一个与训练样本X对应的标签向量y

>>> yarray([0, 0, 1, 1, 2, 2])

如果直接使用numpy.array_split，它会变成

>>> np.array_split(y,2)[array([0, 0, 1]), array([1, 2, 2])]

如何将y和X分割成两个文件夹，使y变成

>>> y1array([0, 1, 2])>>> y2    array([0, 1, 2])

附注：每个标签的样本数相同。我希望将它们等量分割到文件夹中，并且每个文件夹中每个标签只包含一个样本。

回答：

以下解决方案的效率是切片解决方案的五分之一。因此，我在这里添加它只是为了完整性考虑。

a, b = y.reshape(y.shape[0]//2, 2).Tprint(a)#array([0, 1, 2])print(b)#array([0, 1, 2])

学技术